ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

新潟コンサルタント横田秀珠コミュのカタカナの全角と半角に見るYSTのアルゴリズム

  • mixiチェック
  • このエントリーをはてなブックマークに追加
先日、にらっちさん
 http://mixi.jp/show_friend.pl?id=14889092
から質問がありました。


Yahooの検索エンジンに関する不可解な現象です。



それは、ウチのサイト
 http://www.bonanzas.jp
について
 Yahooで全角「チュニック」と検索すると82位なのに
 Yahooで半角「チュニック」   と検索すると10位になる
んだけど、なんで??

と言うものでした。


確かに、半角と全角では文字コードが違うので
検索結果が違っても不思議ではない。


しかし、日本人の感覚では、半角だろうが全角だろうが
カタカナで書かれていれば同じ意味だから
検索結果は揃えてほしいと思うのが普通である。

したがって、検索エンジンには入力時のゆれとして
同じ結果を出すようにアルゴリズムを作ることは簡単である。



実際に、全角と半角で検索結果を比較してみた。

Yahoo「チュニック」の検索結果
 http://search.yahoo.co.jp/search?p=%E3%83%81%E3%83%A5%E3%83%8B%E3%83%83%E3%82%AF&ei=UTF-8&fr=top_beta&x=wrt

Yahoo「チュニック」の検索結果
 http://search.yahoo.co.jp/search?p=%EF%BE%81%EF%BD%AD%EF%BE%86%EF%BD%AF%EF%BD%B8&ei=UTF-8&fr=top_beta&x=wrt

2つを比較すると、ほとんど同じである。

違うのは、
 全角で 9位 チュニック ベルーナネット
 半角で10位 チュニック通販 【チュニックBEST店】
だけである。


ところが、
 全角で 9位 チュニック ベルーナネット
のサイトは
 半角で15位 チュニック ベルーナネット
に出てくる。



このように全角で引っ掛かっているサイトは
半角でも順位が多少前後しても掲載されている。

ところが、このサイト
 http://www.bonanzas.jp
は、全角82位と半角10位で随分と順位が違う。。。


不思議である。。。



ちなみに、Yahooでは検索結果のゆれについて
 http://help.yahoo.co.jp/help/jp/search/web/web-08.html
に書いてある。


ここを読むと
 ゆれの種類 例
 代用漢字 沈殿・沈澱
 異体字 國・国
 カタカナ語ゆれ ダイアモンド・ダイヤモンド
 送り仮名 引っ越・引越・引っ越し・引越し
が現在対応している表記のゆれと書いてある。


全角と半角のゆれは書いていない。



他の例でも試してみた。

Yahooで「カタログギフト」と検索すると
 http://search.yahoo.co.jp/search?p=%E3%82%AB%E3%82%BF%E3%83%AD%E3%82%B0%E3%82%AE%E3%83%95%E3%83%88&search.x=1&fr=top_beta&tid=top_beta&ei=UTF-8
Yahooで「カタログギフト」と検索すると
 http://search.yahoo.co.jp/search?p=%EF%BD%B6%EF%BE%80%EF%BE%9B%EF%BD%B8%EF%BE%9E%EF%BD%B7%EF%BE%9E%EF%BE%8C%EF%BE%84&ei=UTF-8&fr=top_beta&x=wrt
となるが、上位50位について言えば1つの狂いもなく全く順位が同じである。


検索数で比較しても、今年の4月の数字では
 チュニック   362,432回
 カタログギフト  44,287回
という風に、圧倒的に多いのはチュニックである。




ここで、ちょっと考えてみた。


全角と半角のゆれが問題なのかな?と思って
全角と半角のゆれを含めない検索をしてみた。

1.検索語入力欄を使う
キーワードを"(半角のダブルクォーテーション)で囲んで入力します。
または、キーワードの前に+(半角のプラス記号)を入力します。

2.検索オプションを使う
Yahoo!検索のトップページ、またはウェブ検索結果のページ右にある[検索オプション]をクリックし、
[検索オプション ウェブ検索]ページにある[表記のゆれ]で、[ゆれを含めない]を選択して検索します。

3.検索設定を使う
表記のゆれを含まないように設定を保存できます。詳しくは「検索設定の使い方」をご覧ください。

の中の1で検索してみた。


表記のゆれを含まずYahoo「チュニック」の検索結果
 http://search.yahoo.co.jp/search?p=%22%E3%83%81%E3%83%A5%E3%83%8B%E3%83%83%E3%82%AF%22&ei=UTF-8&fr=top_beta&x=wrt

表記のゆれを含まずYahoo「チュニック」の検索結果
 http://search.yahoo.co.jp/search?p=%22%EF%BE%81%EF%BD%AD%EF%BE%86%EF%BD%AF%EF%BD%B8%22&ei=UTF-8&fr=top_beta&x=wrt


すると。。。
 表記のゆれを含まず検索するとYahoo「チュニック」 10位
 表記のゆれを含まず検索するとYahoo「チュニック」    82位


んんんん?

さっきと逆になっている。
 表記のゆれを含んで検索するとYahoo「チュニック」 82位
 表記のゆれを含んで検索するとYahoo「チュニック」    10位



ということは表記のゆれの中に、半角と全角も含まれていることになる。


これは日本語だけの問題である。
英語では半角しか無い。


そこで、今度は英語のアルゴリズムならどうなるのか調べてみた。
 http://www.yahoo.com
ここで検索してみた。


Yahooで「チュニック」と検索すると
 http://search.yahoo.com/search?p=%E3%83%81%E3%83%A5%E3%83%8B%E3%83%83%E3%82%AF&ei=UTF-8&y=Search&fr=yfp-t-501&xargs=0&pstart=1&b=11
Yahooで「チュニック」と検索すると
 http://search.yahoo.com/search?p=%EF%BE%81%EF%BD%AD%EF%BE%86%EF%BD%AF%EF%BD%B8&ei=UTF-8&fr=yfp-t-501&xargs=0&pstart=1&b=11
全角と半角に関わらず20位である。


Yahooは、日本の検索エンジンとアメリカの検索エンジンでアルゴリズムが違います。
アメリカのアルゴリズムに、日本語ならではの特長を付加して日本のアルゴリズムが出来ています。


しかし、この結果を見ると、アメリカの検索エンジンは全角と半角のゆれが無く素晴らしい。



全角のチュニックでは10位なのに、半角というゆれを考慮するから82位に下がっているとすると
半角でゆれを考慮せずに検索した結果の82位は納得である。

逆に半角のチュニックで82位なのに、全角というゆれを考慮するから10位に上がっているとすると
全角でゆれを考慮せずに検索した結果の10位は納得である。





で、結論は???




明らかに、表記のゆれの影響を受けているのは確かである。
ただ他のキーワードのように全角と半角での表記のゆれによる順位の違いがないので
近い将来に統一されると思う。

問題は、どちらに統一されるのか??

10位になるのか?

82位になるのか?


36万回のキーワードである。
10位になると、とんでもないアクセス数と売り上げになるだろう。


私は10位になると思う。

なぜなら、アメリカで20位という評価があるから。
全角と半角で区別無く20位ですからね。

さらにMSNでも全角と半角で区別無く6位ですからね。

コメント(5)

分析ありがとうございました。

よこたんさんの予想どおり現在全角でも10位になりました!

「ゆれ」ですかぁ
???ですねぇ。

なにはともあれ10位です。
今は夜中なのでアクセスは伸びていませんが朝以降が楽しみです。

しかし、チュニックってYahoo!の広告大きくないですか?
3位までじゃないと1画面に出ません(涙)

つまり、目指せ3位以内ってか!!!!!
ね!

にらっちさんは、もちろん努力されたと思いますけど
チュニックは楽勝だよ、って言いましたよね。

ビッグキーワードの割に周りが弱いんですよね。


たぶんインデックスが完璧でない状態だったんですね。
半角と全角の互換が出来ていなかったというか。


ちなみに私のパソコンでは、1.5位までしか出ませんげっそり
やっぱスクリーンショットを取っておいて良かった。

これを取っていないと、この分析が無駄になっていた。
これ2時間くらいかかったんだよ。

でも、36万回で10位は私の知っている人の中で
ダントツに1番のSEO成功者ですね!!

凄いですよ。


もう私から卒業だなウッシッシ
「ちゅにっく」でもYahooで上位表示と、わかりんさん。

http://search.yahoo.co.jp/search?p=%E3%81%A1%E3%82%85%E3%81%AB%E3%81%A3%E3%81%8F&search.x=1&fr=top_beta&tid=top_beta&ei=UTF-8

理由は、この検索結果の上に書いてあるとおり。

 チュニックも含めて検索しています。ちゅにっくだけで再検索。

カタカナとのゆれということですね。
あなたの検索は「正式名」派?「発音」派?
 http://searchranking.yahoo.co.jp/trend/07121102

ちょっと関係あるかな?

ログインすると、みんなのコメントがもっと見れるよ

mixiユーザー
ログインしてコメントしよう!

新潟コンサルタント横田秀珠 更新情報

新潟コンサルタント横田秀珠のメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング