Principal EngineerのMatt Cutts氏によると、近年、純粋なウェブスパムが減少傾向である一方、新たに内容が薄っぺらで低品質なコンテンツを掲載する「コンテンツファーム」に関心が集まっている。2010年にGoogleはこうしたサイトが検索上位に表示されないようにアルゴリズムの改良を実施しているが、必ずしも十分に機能しているわけではないのが実情だ。検索利用者からのこうした声を受けて、アルゴリズムの更なる改善に踏み切った。
As we’ve increased both our size and freshness in recent months, we’ve naturally indexed a lot of good content and some spam as well. To respond to that challenge, we recently launched a redesigned document-level classifier that makes it harder for spammy on-page content to rank highly. The new classifier is better at detecting spam on individual web pages, e.g., repeated spammy words—the sort of phrases you tend to see in junky, automated, self-promoting blog comments. [Google search and search engine spam, Google Blog]