mixiユーザー(id:22942022)

2019年02月03日08:29

98 view

週記428 Kaggle

 Data Scienceを実践的に学ぶためにどうしたらいいだろうか、といろいろ調べていて行き着いたところにKaggleがありましたので、今回はこれについて書いていきたいと思います。

 Kaggle(カグル)というのは、浅い私の理解で簡単に言うと、Machine Learning(機械学習)を用いて国内外の企業が賞金付きで出した課題の解決精度を競う(Competitionする)サイトになります。

様々な企業がKaggle社の提供するこのサイトにエントリーしており、例えば日本の企業でいえばメルカリなどが「商品画像から出品の適正な値段設定をRecommendする方法」についてのCompetitionを開いています。(もうCloseしたかもしれません)

賞金は大体数十万円から一千万円まで様々ありますが、賞金目的以外で勉強のために参加している人も数多くいます。

 Kaggleの特徴は幾つかありますが、専門的なことを省いて言えば、課題設定(或いは評価関数:作った機械学習のシステムの性能を評価する指標)が既に企業側からあたえられていることが最も優れた点です。(他には機械学習の開発環境とかいろいろあります)

つまりdata scienceをする上でもっとも重要で難しく、少なからぬ経験を要する課題設定が適切に与えられている(少なくとも企業のdata scientistが精査して設定している)ということがポイントです。

competitionに参加することはデータ(全てではない)も課題設定もクリアになっている課題で、実際のビジネスで必要とされている技術の開発・挑戦を通じてトレーニング出来るというわけです。

 また、全てではありませんが、同じく学習目的でやっているような他のCompetiterたちのコードは説明文付きで公開されている事が多く、一つの課題について他人のアプローチを見て参考にできるという利点もあります。

機械学習の初心者にとってはデータの前処理(pre-processing)やほしいデータの適切な出力方法も十分わかっていないことが多いですので、他人の書いたコードを読むことはとても勉強になりますし、自分のコードを改善するのにとても役立ちます。

 とまあいろいろいいところがあるKaggleです。

世界中のData Scientistの活動が見れるのも面白いですが、その中に飛び込んでいって自分なりの機械学習プログラムを作って行くのも面白いです。

まだまだプログラムを書くことについては自由自在とは言えませんが、頑張っていこうと思います。

以上。

【最近のperson】
・Pete Grey(Photo No.1)
He was a Major leaguer in America. He had terribly hard trouble when he was 5 years old child, he lost his right arm by accident. But he trained very hard after the accident, and finally he become Major leaguer!
And he left following word that describe his own life.
“A winner never quits”

【最近のCount Down】
After 538 days, the time will come.
0 0

コメント

mixiユーザー

ログインしてコメントを確認・投稿する

<2019年02月>
     12
3456789
10111213141516
17181920212223
2425262728