蔵前教授の白熱!検索教室 第2話「Google検索を組織としてとらえてみれば」の巻

この物語について

2023年春。ここ、東京・秋葉原はインバウンド観光が再開され海外の観光客が多く訪れるようになり、街全体が活気を取り戻しつつある。

その片隅に校舎を構えるJADE大学は、検索エンジンの過去・現在・未来及びそれを活用したビジネスの在り方を研究している「検索教養学部」が設置され5度目の新学期を迎えた。

この物語は、検索教養学部で繰り広げられる教授と生徒たちの白熱の議論をお伝えするものである。

第1話のストーリー「IQFから始めよう」の巻はこちら

 

登場人物紹介:

蔵前教授

検索エンジンなど社会へ大きなインパクトを与えるプラットフォームを長年研究。特にスパム検出のアルゴリズム開発については複数の企業で実務者としても関わってきた経験を持つ。

趣味はスプラトゥーンと、イギリス製ミニチュアゲーム製作。長期休みがあると旧街道を歩き回るクセがある。めっちゃ歩いたけどまだ膝は大丈夫。JADE大学は本当は蔵前エリアにキャンパスを開設したかったけど教授会で「ピンとこない」という理由で却下された。せめてとの思いで苗字を改名。

 

一堂スパム(いちどう・すぱむ)

検索教養学部の学生。根はとてもいい奴だが、考えることがついつい脱法的になってしまうクセがある。.xyzドメインを108個持っている。

 

冷越タブロー(れいえつ・たぶろう)

検索教養学部の学生。検索結果を眺めるのが趣味。最近ビジュアライゼーションにはまり出している。目立つのが好きではないため言葉少な目だが、主張したいときはグラフで論破する。

 

外神田唯(そとかんだ・ゆい)

教育学部の学生。夢いっぱいにJADE大学に入学。将来は地元の図書館で司書をしたいとの思いがあり図書館学を専攻しているが、その単位取得の一環で検索教養学部の授業に参加している。活字中毒で、検索エンジンのことは実はあまりよく知らない。正義感が強い。


 

(2場:301教室 通称「パーマネント」にて)

蔵前教授担当の授業開始前の休憩時間中。

外神田唯と冷越タブローが会話をしている。

 

一堂君、授業来れるかしら。

 

ん?どういうこと?

 

最近、授業に来るときいつもやつれていない?食事ちゃんととってるのかな?

 

(小さく微笑みながら)なんだかお母さんみたいなこと言うね。

 

先週、別の授業で見かけたときなんて、どこかで拾ったみたいなボロボロでサイズが全くあってない服を着て、虚ろな目をしていたわ。どうしちゃったのかしら。

 

冷越、自分のノートPCの画面を外神田に見せる.

 

一堂の授業料と生活費をすべて賄ってきた.xyzドメインのサイト群は引き続き絶賛下落中さ。

 

あいかかわらず一堂君のサイトをマークしてるのね。

 

いい研究材料なんでね。きっと、資金が尽きてそろそろ限界なんじゃないかな。ちゃんとアルバイトとかすればいいのに。

 

と、そこへ一堂が元気に教室に入ってくる。

服装は立派で、目は輝きを放っている。

 

おっはよーーー!みんな元気に.zipドメイン買ってるぅ?

 

あまりの変わりように圧倒される外神田と冷越

 

と、とても元気そうだな。

 

いやー、持つべきものは友達だわ!友達 is 最高!.movドメインもあるよぉ!

 

先週の授業でとても元気がなかったから心配していたって話を、今、冷越君としていたところなのよ。

 

いやぁー、それはそれは大変ご心配おかけしました。私、一堂スパム、ご覧のように見事復活を遂げたであります!

 

良かったね!どこでバイト始めたの?コンビニ?

 

ふっ、またろくでもない手段で乗り切ったんだろ。

 

冷越。失敬な!それは俺の友達の優しさに対して失礼だぜ。困っていた俺を助けてくれた同志には感謝しかない。

先週の月曜と火曜はダチの大間(だいま)の下宿に居候になってメシと当面の生活費を世話になってさ、大間の仕送りが底をついたから水曜から物星(ものほし)の下宿に移ってさ、ただただそいつのご厚意に甘えていただけさ。物星の仕送りも底をつきそうだって言うから、そろそろ旅立たなきゃいけないかなと思い始めてるけど。みんな月末はやりくり大変なんだなー(他人事のように)。

 

それは…。

 

それは?

 

…寄生じゃないか。

 

友情と呼びなさい。

 

立場によってこうも現実の捉え方が違うというのも、この病のやっかいなところだよ。唯ちゃん

 

え?

 

通報だ

 

つ、通報?

 

マウンテンビューに通報だ。

 

まうんてんびゅー?

 

Googleの本社だよ。

 

Googleって警察みたいなことするの?

 

URL以外の通報はできないけど、一堂を野放しにしているとインターネットにとって良くないことが起こりそうな気がしてならない。悪寒がする。存在を通報しなきゃ。

 

(真剣な声で)わかったわ。じゃ、電報送りましょう。まうんてんびゅーに。

 

唯ちゃん…は、発想が昭和だね。

 

早くて、確実で便利よ。文面は、「イチドウスパムキトク」かしら。

 

冷越、唯ちゃん!

 

二人、振り向く

 

実は、その、んー、その、次の、次の宿主を絶賛募集中でしてぇ…(二人をじっと見つめる)

 

二人:

えっ

 

二人は、一堂の宿主になってもいいよって、きっと思ってくれてるんじゃないかなーって、だったら俺もなってあげてもいいよぉって。

 

ちょ、ちょっとそれは…。

 

宿主って、やっぱお前確信犯じゃないか

 

教室の扉が開く音。

蔵前教授が入ってくる。

 

みなさんごきげんよう。前回のIQFに関してのレポートはみんな提出できてるかな。

 

はい。提出しました。

 

さっきまで元気だった一堂が教室の床に突然倒れこむ。

 

 

い、一堂君。どうした?

 

蔵前、一堂に近づき介抱する。

 

(蔵前の腕に抱かれながら消え入りそうな声で)きょ…教授、ぼ、僕は、もうダメかもし、しれません。あ、IQF、な、なんて素晴らしい概念なんだ。この高邁な考えに、もっと早く出会ってい、いれば、ゴホゴホ、きっと、きっと正しい、インターネットを良くするウェブサイトを僕も、作れたかも、し、しれないのに。ざ、ざん…ねんです。

 

おぉ…いったいどうしたということかね。

 

教授、、、お願いがあります。

 

なんだね。

 

や、宿主になってもらえませんか。

 

やどぬし?

 

教授、一堂は寄生サイトそのものになってしまいました。ほぉっておきましょう。

 

な!?

 

一堂、突然大声で泣きだす。しばらしくして泣き止み

 

(開き直った感じで)教授、教授、おれも、おれもレポートは出そうと思ったんだ!レポートは出そうと思ったんけどさ、IQFってどうも性に合わないんだよなぁー。第一、地道すぎね?こうさぁ、なんかさ、いい感じにビューって一気に伸ばしたいのよ。ビューって。昔はさ、結構いけたんだけどなぁ。

 

蔵前、あきれる。

 

なんだか最近、Googleが考えてることがよくわかんないんだよなぁ。

 

!今、なんといった?

 

一堂、蔵前の強い口調に少し押されて

 

いや、えーと、Googleが何考えてるのかわかんないなぁ…って

 

一堂君、(サムズアップして)ぐっどじょぶ、一堂君、ぐっどじょぶじゃよ。

 

教授、寄生野郎がグッジョブって、それはあまりにイミフですよ。

 

冷越君、日本語は正しく使って。意味不明でしょ。

 

いやいや、一堂君が今言った「Googleが何を考えているかわからない」、これこそ今日の授業のテーマにしようと思っていた話なのじゃよ。

よし、みんな席に着いて。授業を始めよう。

組織としてGoogle検索を見る

しばしば、SEOについて語る場合、「今のGoogleは」や「Googleのミッションは」といった枕詞から、事象を説明することがあるじゃろう。

 

「Googleの使命は、世界中の情報を整理して、すべての人がアクセスしやすくすること」って、Googleのミッションとしてよく使われますよね。

 

うむ。企業の考えを大まかにとらえるには、そのミッションステートメントを吟味するという発想自体は大事じゃ。それを否定するわけではない。ただ

 

ただ?

 

実務を進めていくには、あまりに粒度が粗いじゃろ。

 

まあ、、たしかに。抽象的なコンセプトは、いかようにも拡大解釈できますし、主観も入りそうです。

 

Googleがアルゴリズムのアップデートを完了するたびに、わしは茶をすすりながら、いつもこう思うんじゃ。

「あぁ…今日もGoogleの中の誰かのOKRが達成された。お疲れ様」と。

 

(冷越に)おーけーあーるって?

 

Objectives & Key Results の略だよ。Google社内の目標管理に使われている制度だよ。

 

外神田、うなずきながらノートにメモする。

 

たとえば、2021年の6月と7月にコアアップデートが連続で行われた時があったじゃろ。

 

確かありましたね。どういう意図だったんだろうとか、色々騒がれた気が。

 

あれは、何か思惑があったというよりは、別々のチームによるそれぞれのOKR達成のための作業がただ淡々となされただけ、という可能性もあるとわしは思っておる。まあ、憶測ではあるが…。

 

あのときの出来事ははっきりと覚えてる。俺がつくった歌詞サイトが6月にはめっちゃ上がってウハウハしたのに、7月にはトラフィックが0になってしまい、ドメインを捨てる羽目に。

誰だ!7月のOKR達成したやつは!ボブか、ジェームズか、それともチェンか!出てこい!

 

一堂君、意外。アーティスト活動してるのね。

 

ただのスクレイピングサイトだよ。

 

え、す、すくれいぴんぐ?

 

つまり、要するに、Google検索も人の子ということじゃ。そして、具体的に言えば、Google検索の理解を深めるのを助けてくれる視点は、検索システムの各処理プロセスを組織としてみることじゃよ。

 

組織?

 

前回、DCIRの話をしたな。

 

はい、覚えてます。Discovery, Crawl, Index, Rankの検索エンジンの処理のステップですよね。

 

素晴らしい。(サムズアップして)ぐっどじゃ。

 

外神田、微笑む:

 

今、外神田君が言ってくれた各ステップごとに別々のチームが存在しており、そのチームが持っている目的は実は別々と考えた方がいいんじゃ。重要なのは、それぞれのチームが何を考えてその部分のコンポーネントを作っているか、に想像力を及ばせることじゃ。

 

えっ!同じ会社なのに。

 

詳しく説明しよう。

 

と、蔵前、黒板に向かう。

各チームが考えていることとは

まずは、ディスカバリーじゃ。この部分を担当するチームの視点に立って考えた時、最も重要なミッションはインターネット上に存在するURLをたくさん発見すること、すなわち「網羅性」じゃと考えられる。

 

URLは、HTMLの<a>タグを辿りながらみつけていくわけですよね。

 

確かにそうじゃ。じゃが、彼らのミッションから考えるなら、<a>タグで書かれていないURLも発見したいはずじゃ。とにかく網羅性を高めたいのじゃからな。サイトのディレクトリ構成が明確にパターン化されていることが分かれば、そのルールから推定してリンクをたどることなくURL発見しようとすることだってできる。

 

え!...しらなかった。

 

クロールを担当するチームにとっては、別のことが重要になってくる。考えてみてほしいが、彼らにとって大事なのは「効率性」じゃ。いくらたくさんのURLをディスカバリチームが用意してくれても、そのすべてをクロールするわけではない。

 

そうなんですか!...なんだかもったいない。

 

クローラーが利用する計算リソースは巨大とは言え有限じゃし、クロールされるサイト側のサーバーに対しても負荷をかけないように配慮しなくてはならない。

 

クローラーって、気遣いの人なんですね。

 

(微笑みながら)そうじゃ。クロールチームの立場からすれば、効率性が大事じゃから、できることなら「クロールする前に、そのURLは価値のある情報があるのかどうか」を知りたいとも思うじゃろう。

 

ク、クロールするまえに…

 

機械学習などを活用しながら、例えばこのディレクトリは価値が低そうだから、クロール頻度を下げるといった判断を大量URLサイトがある場合はあり得る話じゃ。

また、ウェブの常識とは異なる挙動、たとえばwwwありとなし、htmlとhtmで違うコンテンツを用意してしまう、などは避けるべきじゃのぉ。

 

ウェブのスタンダードに沿わないふるまいは問題になるということですね。

 

ぐっどじゃ。

 

みんな三人とも、教授からグッドもらえたわよ!きゃ!

 

そしてインデックスを担当するチームはさらに様々なことを考えなくてはならない。クロールされたURLのうち、Google検索のインデックス、すなわち索引に登録する役目を担うわけじゃ。ここでもまた、価値のあるURLだけをインデックスすることが重要じゃ。そのためには、ページ上にあるコンテンツの分析やページ間のつながりの分析、すなわちリンク分析をしっかり行う必要がある。

 

リンク大好き!

 

また、重要な作業の一つは、Canonicalisation、すなわちURLの正規化じゃな。クロールチームが発見してくれたURLには多くの重複URLが含まれておる。重複を検出し、その中から代表となるURLを決めるのは、インデックスチームの大事な仕事じゃ。

その上でコンテンツやリンクのシグナルを、ランキングを決定する際に使いやすいように加工するのじゃ。

 

三人、教授の話に聞き入っている。

 

こういった作業をURL単位だけでなく、ドメイン単位、サイト単位、ホスト単位といったより大きな粒度でも行っておる。URL単位は現在のシステムではかなりスピーディーにオンラインで行われるが、昔はバッチ処理じゃった。インデックス処理がバッチ処理でアップデートされるたびにランキングが変動するので、それが Google Dance という単語の由来となったんじゃ。いまでも、すべてがオンライン処理に移行したわけではなく、バッチ処理で行われることもある。

 

なんだか、それぞれのチームがミッションドリブンでやりすぎるぐらいにやり切ったものを最後、インデックスチームが整理しているような、うん、なんだからそこで頑張っている人の姿が浮かんできたような気がします。

 

ぐっどじゃ!

 

教授!ランクが知りたいです!ランクを上げるにはGoogleの誰に連絡すればいいですか?

 

それは知らん。その発想はばっどじゃ!

 

くっそぉ!ボブか、ジェームズか、それともウラジミールか!出てこい!

 

じゃが、そうじゃなランキングチームの話も最後にしておこう。

三人、身を乗り出す。

 

インデックスチームが整理した索引データをもとにして、どういった検索クエリに対して、どのようなURLを返すのが適切かをひたすら考えているのがランキングチームじゃな。

実は、ディスカバリー、クロール、インデックスの各チームは大きなまとまりにおいては同じ組織に属しておるのだが、ランキングチームは別なんじゃよ。

 

え、そうなんですか。

 

うむ。先に言った3チームはインフラチームなんじゃが、ランキングはクオリティチームなんじゃ。

japan.googleblog.com

 

3対1なんて….ランキングチーム、ちょっとかわいそう。

 

まあ(笑)、そんな冷遇をされているわけではないから心配は無用じゃよ。面白いのは、この二つのチームのスタンスじゃなぁ。

インフラチームで一番皆が知っているのは、ほら、オフィスアワーによく出てくるジョン・ミューラー氏じゃな。彼の所属するチームは、今はリオルグの結果別の組織に統合されているが、もともとはインフラチームじゃった。彼のスタンスはオープンじゃろ。それは、インフラチームにとっては各ウェブマスターにクロールしやすいウェブサイトを作ってもらうことが大事だからじゃ。

 

インフラチームはオープン…。

 

それに比べると、クオリティチームは秘密主義じゃな。やはりランキングは Google という企業にとって最も守るべき秘密じゃ。また、スパム対策という重要なミッションもある。

 

僕の名前が呼ばれた気がします。

 

クオリティチームは秘密主義…。

 

もう伝説的な存在じゃが、Googleで一番最初にウェブマスターとのコミュニケーションを担ったマット・カッツ氏は、クオリティチーム内のウェブスパムチームの責任者じゃ。だから彼はアルゴリズムについて語ることができる。

だが、ジョンは実は、そこは専門ではない。一方、インフラに関わる、いわゆるテクニカルSEOの部分は大変詳しい。

そんなことを気にしながら、オフィスアワーの回答を聞いてみると新しい発見もあるはずじゃ。

 

検索結果のタイトルやスニペットは、どのチームですか?

 

ぐっどくえすちょんじゃ!タイトルやスニペットについては、実はクオリティチームの中にスニペットチームというのがあるのじゃ。

それぞれのチームにはしばしば、十数年ひたすら同じチームで改善を続けている古参のエンジニアがいるのじゃよ。

 

熟練の職人さんみたいですね。

 

ははは。そうなんじゃよ。Google検索の中の組織をよーく見てみると、実はあるテーマを10年以上、15年以上、ひたすら取り組んでいるという匠が何人かおるのじゃ。表からは良く見えんがな。

 

その意味では、とても属人的なところもあるんじゃ。

 

教育テレビのはたらくおじさんみたい…

 

唯ちゃん、今はEテレだよ。番組名もずいぶん昭和だな。

 

このようにGoogle検索をひとつの大きなまとまりとしてではなく、各プロセスごとに、その組織で働いている人々のOKRなんかを想像してみると、Search Console のインデックスの統計データやURL検査データが味わい深いものになっていくじゃろう。

 

三人、懸命にノートを取る。

と、授業終了のチャイムが鳴る。

 

お、もうこんな時間か。

 

蔵前教授が、そそくさと退室の準備を始める。

 

先生、質問があります!

 

一堂君、質問に答えたいのはやまやまだが、このあと末広町のボドゲ喫茶に友達を待たせておるんじゃ。

みんな、次回はDCIRをさらに少し深堀して話をする予定だから、少し予習をしておいてくれ。

 

ごきげんよう。失礼。

蔵前教授、猛ダッシュで教室を去る。

 

 

蔵前教授、子供のような顔をして嬉々として出て行ったわね。

 

あのあたりのギャップは謎だね。

 

第二話完。

 

第1話のストーリー「IQFから始めよう」の巻はこちら