どこかに書いていたブログ2

今はもう存在しない netks.org

HTML5セマンティックのウソ

2017/02/26

タイトルは大上段に振り構えておりますが、大した内容はございません。単なる文句と愚痴の寄せ集めです。

HTML5も単にホームページ(Webページ)作成のためのマークアップ言語だけを指す場合と周辺技術を含めてのHTML5という場合があるようです。私個人は特に使いませんが、たくさんの技術体系がきちんと整備されブラウザ上で動作することは大変歓迎しておりまして、HTML、CSS、JavaScriptなどでいろいろなことが実現できるのはとてもうれしく思います。

でも、Webページを記述するマークアップ言語としてのHTML5っていかがなものなのでしょうか。セマンティックなHTML要素が追加されHTMLの書き方がわかりやすくなったでしょうか。

わたしは、逆に難しくなってもいいので同じ意味合いを表現するHTMLは、だれが書いても同じになる方がいいような気がします。

そりゃあ、div="header"とするよりもheader要素の方がいいと思いますが、article要素のheader要素だったりfooter要素だったりと使えるのはいいとして使う場合、使わない場合、作る人の一存ってのはどうなんでしょう。

100歩譲ってHTMLは作成する人によっていろいろ違ってもいいです。(譲る必要はなく、もともとそうだとは思いますが)data-属性も独自で規定していいんですね。逆に事細かに決められても困ると思うのですが、サイト、ページによってdate-属性の表しているものが違うというのはいかがなものでしょうか。

もう、100歩譲ってHTML5は書く人により大きく変わり、独自のdata-属性を持てるがセマンティクなので許す。としましょう。セマンティクって何ですか?

セマンティックウェブの項を見るといろいろ難しいことが書いてありますが、

データの意味を記述したタグが文書の含む意味を形式化し、コンピュータによる自動的な情報の収集や分析へのアプローチが可能となると期待されている。

という文があります。一般的にgoogleなどの検索エンジンにサイトの中身をよくわかってもらって検索エンジン利用者ができるだけ正確な検索結果にたどり着けるようにしましょうね、的な理解かと思います。

マシーンリーダブルはgoogleなどの一部検索エンジンのみを指すのでしょうか。検索サイトはクロール結果をGoogleTrendsなどで公表しても著作権侵害にはなりません。

RSSってセマンティクなWebに相反する技術でしたっけ。RSSの転載は駄目っての著作権的なものなのでしょうがリンク先は、元のままでもダメなんですかね?RSSリーダーもWeb上の物は減少傾向のようですが、興味があればクリックしてあなたのサイトに飛ぶんですがね。リンク先が増えて歓迎とはならないのでしょうかね。(もちろんサーバの負荷の観点からならよくわかります。ミリ秒単位でアクセスされても困りますからね。)

一般のサイトは別サイトからデータ引っ張ってきて再利用するというのはセマンティクではないのですかね。

どっかのサイトが膨大な書籍のデータを公開していてそのサイトのHTMLを読み込んで必要なものだけ利用させてもらう。どっかのサイトが薬のデータを公開していてそこから読み込んで引用させてもらう。どっかのサイトが気象データを公開していて利用させてもらう。どこかがニュースを公開していて利用させてもらう。

一般のサイトが自前でデータベースを用意しなくても公開サイトから利用させてもらうのは駄目なんですかね。もちろんデータ収集やデータ管理にコストがかかっているのはわかりますが、公開データですぜ。

さらに、前述のGoogleTrendsなどはソース見てもJavaScriptが書いてあるばかりでそれらしいHTMLが見当たりません。マシンリーダブルではないですね。もちろんAPIが提供されていたり(無償で、利用制限なしを希望)RSSがあったりしますが、https化されていたりして読み込めなかったりします。

googleさんの希望通り、リッチスニペットでも AMPでも使いますから(めんどくさそうでまだ使ってませんが)google様の公開データは無償で再利用が簡単な方向でお願いします。