On Fri, Nov 14, 2008 at 10:44 AM, Pentasis <span dir="ltr">&lt;<a href="mailto:pentasis@lavabit.com">pentasis@lavabit.com</a>&gt;</span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">






<div bgcolor="#ffffff"><div class="Ih2E3d">
<div dir="ltr" style="margin-right: 0px;"><font size="2" face="Arial">&gt;&gt;&gt;If we 
wish to communicate that level of semantics, yes.&nbsp; It may not be useful to 
us.&nbsp; If you *really* need some metadata/semantics, @class probably can&#39;t 
convey it with enough granularity.&nbsp; Check out the big discussion from a few 
months ago about ccRel and RDFa.<br>&nbsp;</font></div>
</div><div><br><font size="2" face="Arial">Not yet maybe, but we could at least try to 
keep options open for the future.</font></div></div></blockquote><div><br>Of course, but I don&#39;t think having &lt;small&gt; in the language closes any options.<br>&nbsp;<br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div bgcolor="#ffffff"><div dir="ltr" style="margin-right: 0px;"><font size="2" face="Arial"><div class="Ih2E3d">&gt;&gt;Second: Suppose I want to collect all copyright notices from 1000 
websites (don&#39;t ask me why, I just want to), how am I to do this when they are 
marked up in &lt;small&gt;s? I will definatly end up with a lot of text that has 
nothing to do with copyrights (and probably miss a lot of copyright notices as 
they are marked up differently) Whereas If they were maked up in (for example) 
&lt;span class=&quot;copyright&quot;&gt; I could retrieve it all based on the 
class-name.<br><br>&gt;&gt;&gt;That would be a wonderful perfect world.&nbsp; 
I&#39;d like the copyright date as well, so I can retrieve only things copyrighted 
in the last ten years.&nbsp; Assuming that metadata will exist is a fool&#39;s 
errand.&nbsp; The fact is that if you are searching for copyright notices, the 
most efficient way is likely to just search for the string &quot;copyright&quot; and the 
(c) symbol.&nbsp; That&#39;ll net you copyright notices with a high accuracy, and 
some training on real data can yield further rules to improve the data-mining 
accuracy.<br><br></div>You say it yourself, only in a perfect world where all websites 
in the world would be written in the same language would your &quot;solution&quot; work. 
Unfortunatly I would miss out on all the chinese copyright stuff.</font></div></div></blockquote><div><br>Of course.&nbsp; But would you expect chinese speakers to use class=&quot;copyright&quot; on their pages anyway? <br></div>
<div>&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div bgcolor="#ffffff"><div dir="ltr" style="margin-right: 0px;"><font size="2" face="Arial">But another 
example (based on &quot;siemens&quot;) wouldn&#39;t it be nice if I could tell Google I am 
looking for a person named &quot;Siemens&quot; so it would ignore the 
&quot;brand&quot;-name?</font></div></div></blockquote><div><br>Certainly.&nbsp; But at this point you&#39;re expecting authors to mark up their pages with metadata every time they mention someone&#39;s name.&nbsp; The use of &lt;b&gt; doesn&#39;t prevent this, but your use-case certainly requires quite a lot more.<br>
&nbsp;<br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div bgcolor="#ffffff"><div dir="ltr" style="margin-right: 0px;"><font size="2" face="Arial"><div class="Ih2E3d">
&gt;&gt;&gt;While we&#39;re hoping for copyright notices to 
be marked up as &lt;span class=&quot;copyright&quot;&gt;, though, why not wish for 
&lt;small class=&quot;copyright&quot;&gt;?&nbsp; If you&#39;re going to be providing metadata, 
it works the same.&nbsp; Is it that you believe people won&#39;t provide a special 
class for copyrights if the &lt;small&gt; tag already gives them the preferred 
display?&nbsp; Do you believe that everyone will automatically use 
class=&quot;copyright&quot; to mark up their copyright notices?&nbsp; What if they use 
class=&quot;copyright-notice&quot;?&nbsp; Or class=&quot;license&quot;?&nbsp; Or any of a million 
other distinct possibilities that would destroy any naive attempt to datamine 
based on a particular class name?<br><br></div>Well, that would have to be defined 
in the standard, wouldn&#39;t it? I&#39;m not saying -again- it should be defined NOW, 
but at least leave the door open.<br>I have no problems with using small over 
span, neither one is correct as far as I can see, in this context. Using 
&quot;copyright&quot; instead of &quot;license&quot; or &quot;copyright-notice&quot; would have to be defined 
somewhere, either in the standard or in an externally maintained &quot;document&quot; that 
is accepted as &quot;best practice&quot; or &quot;standards related&quot;.</font></div></div></blockquote><div><br>Okay, then we have no issue with &lt;small&gt;.&nbsp; There has been some discussion, btw, about standardizing a set of normative class names.&nbsp; You should be able to turn something up about it.<br>
<br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div bgcolor="#ffffff"><div dir="ltr" style="margin-right: 0px;"><font size="2" face="Arial"></font></div>
<font size="2" face="Arial">PS: I find it 
very difficult to respond to rich-text/html messages as they seriously mess up 
the indentation. Sorry therfor if this message is unclear as original message 
and reply are mixed up.</font></div>
</blockquote></div><br>No problem; it was clear enough.&nbsp; The only richtext I use is quote levels, and with the conversation context nearby anyway, it&#39;s not difficult to puzzle out when it occasionally messes up.<br><br>
~TJ<br>