<pre><font size="4">Thank you both Martin and Thomas for your feedback. I think the quickest way around this is <br>to get our network people to arrange for the firewall exception. I've looked into it from the <br>java perspective, there's too much trial and error / research involved and there are time <br>
constraints.<br><br>BTW doing a export _JAVA_OPTS='-Dhttp.proxyPort=<a href="http://myproxy.co.uk">myproxy.co.uk</a> -Dhttp.proxyPort=80' prior<br>to running the build.py doesn't seem to help either.<br><br>So with these firewall exceptions (for outgoing connections on ports 80 and 443) in mind, my question <br>
is now this: to WHICH target hosts on the internet shall we authorise the exceptions? The<br>network security people need to know, because naturally (as is their nature :) they refuse<br>to set up an exception to "just anywhere".<br>
<br>Thomas you mentioned various dependencies are needed from </font><font size="4"><a href="http://www.iana.org/assignments/character-sets,">http://www.iana.org</a></font><font size="4"> ... and I could do<br>a big rgrep and some sedding for http://* in checker/ to see about anything else, but there seems <br>
to be so much that I'm not entirely sure where else is relevant in the massive directory tree under<br>checker/. I can also see more items being needed (possibly) from <a href="http://www.w3.org">http://www.w3.org</a>, and <a href="http://xml.org">http://xml.org</a>, <br>
mentions of <a href="http://www.apps.ietf.org/">http://www.apps.ietf.org/</a>, <a href="http://www.junit.org">http://www.junit.org</a>, and possibly other places from other <br>directories outside checker/dependencies. Are the problem downloads solely from .java modules? I would <br>
assume so from what you're saying, but maybe not.<br><br>Does anyone have an idea of the exact list of targets, or how to narrow these down, or shall I just <br>throw in anything I can find using rgrep/sed? I simply want to avoid doing a to and fro with our<br>
network people, and make build/py work the first time.<br><br>Thanks,<br><br>Andrei<br><br>On Tue, Dec 13, 2011 at 1:40 PM, Martin Sharratt
<<a href="http://lists.whatwg.org/listinfo.cgi/implementors-whatwg.org">Martin.Sharratt at uwe.ac.uk</a>> wrote:
><i> Are you behind a firewall, and do you need to set a proxy to get to the
</i>><i> Web?  My server is and I had to create a firewall exception for the server
</i>><i> outbound on TCP ports 80 and 443.    Re-running the build.py script then
</i>><i> completed successfully and I got a working validator.
</i>><i>
</i>><i>
</i>><i>
</i>><i> Ideally java should honour any system proxy settings but it doesn’t seem
</i>><i> to.  I’ve done the usual cursory research and have not really found any
</i>><i> simple way of setting a proxy for java – apparently it’s most often done
</i>><i> within the code.  As usual this was a rush job so I’ve not had time to
</i>><i> research more thoroughly once I got a working system.
</i>
See <a href="http://docs.oracle.com/javase/6/docs/technotes/guides/net/proxies.html">http://docs.oracle.com/javase/6/docs/technotes/guides/net/proxies.html</a>

I too believe this is a network issue (see
<a href="https://bitbucket.org/validator/syntax/src/f370b59cb78a/relaxng/datatype/java/src/org/whattf/datatype/data/CharsetData.java#cl-54">https://bitbucket.org/validator/syntax/src/f370b59cb78a/relaxng/datatype/java/src/org/whattf/datatype/data/CharsetData.java#cl-54</a>
where the connection is made to
<a href="http://www.iana.org/assignments/character-sets,">http://www.iana.org/assignments/character-sets,</a> and note that you can
make a local copy and override the URL by setting the
-Dorg.whattf.datatype.charset-registry system property; I don't know
how to set it through build.py though, as I never used it)

-- 
Thomas Broyer
/t<a href="http://xn--nna.ma.xn--bwa-xxb.je/">ɔ.ma.bʁwa.je/</a></font></pre>