30歳過ぎから工学 vol.2

http://d.hatena.ne.jp/j130s/ から移行しました.オープンソースロボットソフトウェア技術者兼主夫. 高校・大学学部文系-->何となくソフトウェア開発業-->退職・渡米,テキサス州でシステムズ工学修士取得,しかし実装の方が楽しいと気付き縁があったロボティクス業界で再就職.現在 Texas 州内の産業用オートメーションのスタートアップに Georgia 州から遠隔勤務.

unstructured webpages replaces the theory "hub & authority"

what is the definition of "structured webpages"?
one source,


http://www.ciojp.com/contents/?id=00002730;t=16
情報の有効活用をねらうすべての組織にとって、構造化されていないデータ(すなわち、データベース化や高速検索のためのインデックス化がなされていないデータ)の管理性を向上させることは、避けて通ることのできない重要課題となりつつある。米アクセンチュアのパートナーで、エンタープライズ・コンテンツ・マネジメント(ECM)やビジネス・インテリジェンス(BI)に関する技術に精通するタミー・アライリス氏によれば、なんと「企業の保有するデータの80%は構造化されていない」のだ。これはつまり、企業内に存在するデータのほとんどが、価値を引き出すのが困難な状態にあるということを意味する。
summary: it is "data with index".
second source,

http://www.ei.sanken.osaka-u.ac.jp/sw-ont/papers/SIG-SWO-A303/SIG-SWO-A303-10.pdf
提案する検索結果の構造化の目的は、検索結果においてユーザが自身の検索の目的に合ったコンテンツをコンテンツの機能と情報源の選択を可能とすることにより、ユーザの情報検索を効率化することである。
summary: it is to have searchable items in order to enable adapting to searcher's objective.
then, unstructured pages are to be focused(old article, thought).

http://japan.cnet.com/special/story/0,2000056049,20064426-2,00.htm
しかし、IBMの研究者は徐々にこの理論から遠ざかっていく。ハブとオーソリティの理論が軽視しているページ、つまり掲示板やBlog、ニュースグループといった構造化されていないページの方が、興味深いデータを引き出すにあたって役立つと考えるようになったからだ。この発見からWebFountainが生まれた。
「我々が着目しているのは、レベルが低く、どうしようもないページだ」とGruhlは語る。