Schi Heil と叫ぶために

hiroakiuno's blog

書評とまとめ - 人工知能は人間を超えるか ディープラーニングの先にあるもの

バズワードと呼ばれるほど盛り上がっている人工知能。その鍵となるディープラーニング。著者は実力以上のブームに警鐘を鳴らす一方で、本のタイトルである「人工知能は人間を超えるのか」に対して次のように答えている。

人工知能は人間を超えるのか。答えはイエスだ。

もしかすると自分が生きているうちにそんな時代が来るのかもしれない。

最近の人工知能について知りたければまずはこの本からというレビューが目立つだけあって確かにわかりやすい。前半は機械学習ニューラルネットの歴史を踏まえながら今のディープラーニングに至るまでの技術的な説明。後半は我々社会への影響と今後の課題および熱いメッセージだ。

まずはブームに警鐘を鳴らす方の冷めた部分の整理から。

ちょうどこの本を読んでいる時と同じタイミングで以下の3つの記事を読んだ。世界トップレベルの技術をもってしても、ドローンは着地すらできないし、ロボットが攻めてきてもドアを閉めれば十分で、ネズミにも昆虫にも勝てないレベルらしい。

また、産総研イベントでも次のように言っている。

今の人工知能ブームについて、1980年代の第2次ニューロブームのときのことを思い出さざるを得ないと述べて、これまでの人工知能研究の歴史を振り返り、警告を発した。今の人工知能技術の基礎はいずれも当時出てきたもので、そこから本質的な飛躍はないという。
【森山和道の「ヒトと機械の境界面」】しなやかに人間によりそえる人工知能を ~産総研 人工知能研究センター(AIRC)始動へ - PC Watch

それでもなぜディープラーニングにここまで期待が集まるのか。著者は次のようにまとめていた。

人工知能の60年に及ぶ研究で、いくつもの難問にぶつかってきたが、それらは「特徴表現の獲得」という問題に集約できること。そして、その問題がディープラーニングという特徴表現学習の方法によって、一部、解かれつつあること。特徴表現学習の研究が進めば、いままでの人工知能の研究成果とあわせて、高い認識能力や予測能力、行動能力、概念獲得能力、言語能力を持つ知能が実現する可能性があること。そのことは、大きな産業的インパクトも与えるであろうこと。知能と生命は別の話であり、人工知能が暴走し人類を脅かすような未来は来ないこと。それより、軍事応用や産業上の独占などのほうが脅威であること。そして、日本には、技術と人材の土台があり、勝てるチャンスがあること。


続いてディープラーニングの技術面。ネットにはいろんなレベルの解説があるが、この本を読んで、要はこれまで特徴量だけは手動で決めていたのを、自動で獲得できるようになったことが一番のブレークスルーだと言ってよいことがわかった。

本書からいくつかポイントを拾ってみる。

ディープラーニングが従来の機械学習とは大きく異なる点が2点ある。1つは、1層ずつ階層ごとに学習していく点、もう1つは、自己符号化器(オートエンコーダー)という「情報圧縮器」を用いることだ。

ところが、その実、ディープラーニングでやっていることは、主成分分析を非線形にし、多段にしただけである。

そのためにどういうことをやるかというと、一見すると逆説的だが、入力信号に「ノイズ」を加えるのだ。

たとえば、ドロップアウトといって、ニューラルネットワークニューロンを一部停止させる。

画像認識の精度が上がらなかったのは、頑健性を高めるためにいじめ抜くという作業の重要性(専門的に言うと、正則化のための新しい方法)に気づいていなかったため、そして、そもそもマシンパワーが不足してできなかったためである。

実際、多くの研究者が考えていた「自己符号化器をベースに特徴量を多段にしていけばよい」という予想は正しかったのである

自己符号化器と主成分分析にはいくつか違いがある。まず、自己符号化器の場合には、非線形な関数を用いている(というより、任意の関数を用いることができる)。2つ目は、主成分分析では通常、第二主成分は第一主成分の残余から計算されるので、第一主成分の影響を強く受ける。第三主成分は、第一、第二主成分の影響を強く受ける。したがって、高次の主成分になると、ほとんど実質的な意味がなくなってくる。

いまディープラーニングで起こりつつあることは、「世界の特徴量を見つけ特徴表現を学習する」ことであり

この事前に教師なし学習で特徴量を学習することを pre-training と呼び、pre-training の結果を用いて全体で教師ありで学習すること fine-tuning と呼んでいるようだ。

その他参考

私の pre-training の理解をまとめるとこんな感じ。

  • 入力データの集合を再現できるように教師なし学習で特徴量を学習すること。本書では「教師あり学習的な方法による教師なし学習」と表現していた。
  • 1層ずつ階層ごとに学習していく点と autoencoder (自己符号化器) で入力と出力が同じになるように学習(パラ―メータの調整)する点がポイント。
  • 入力信号に「ノイズ」を加えて頑健性を上げる。
  • ドロップアウト (過学習を防ぐため、隠れ層のパラメータをランダムに使わないようにして学習する) が精度に貢献している。

(2015/12/20 追記)
1層ずつ学習していくというのはこちらがわかりやすい。これによって gradient vanishing 問題を回避するとある。

また、autoencoder についてはこちらに1万円札を渡して1万円札をうけとるようなものという表現がされていてそんなイメージ。

「1万円札をお店の人に渡して、1万円札をうけとるようなもの」(「考える脳 考えるコンピュータ」J.Hawkins)
http://www.gdep.jp/seminar/20150526/DLF2015-01-MATSUO.pdf

一方で、これだけ盛り上がってしかも結果も出ているにも関わらず、ディープラーニングにはまだまだ解明できていない部分があるらしい。

冒頭に述べたような圧倒的な性能を示した深層学習ではあるが,課題は山積している.

まず,理論面的に解明されていない部分が数多くある.pre-trainingを採用したことによる誤差はどれくらいか?他にも効率のよい学習法はあるのか?pre-trainingが特徴の学習であるとするならば,既存の非線形次元削減や特徴生成とは何が違ったのか?その違いの本質が解明されれ,大規模データとそれにみあう複雑度のモデルが扱うことが可能であるならば,ニューラルネット以外でも深層学習と同等のモデルが獲得できるのか?

一方で,実用面でも,現状では調整すべきパラメータが多く性能を発揮するには忍耐強い調整を必要とするともいわれている.複雑なモデルの獲得には,大規模データを処理できることが必須となるが,並列計算手法の改良はまだまだ必要であろう.
人工知能学会誌 連載解説「Deep Learning(深層学習)」 | 人工知能学会 (The Japanese Society for Artificial Intelligence)

先の産総研のイベントのページでも以下のように言っていて、正直課題は昔と大きく変わっていない。

川人氏は、ニューラルネットワーク学習の最大の困難は、オーバーフィッティング、汎化能力の欠如、次元の呪いだと改めて指摘した

それでも前に前進していることには変わりない。本の後半で著者が述べているのは今後アカデミア(研究・オープン)とインダストリー(企業・ビジネス)のバランスが大事だということだと思う。

逆に言うと、特徴表現学習の部分を特定の企業に握られたり、ブラックボックス化されたりすると、非常にやっかいなことになる。特徴表現学習のアルゴリズムがオープンにならず、「学習済み」の製品だけが製造・販売されることになると、リバースエンジニアリングで分解したり動作を解析したりして仕様や仕組みを明らかにすることが不可能である。

パソコン時代にOSをマイクロソフトに、CPUをインテルに握られて、日本のメーカーが苦しんだように、人工知能の分野でも、同じことが起きかねない。

現在、ディープラーニングに代表される特徴表現学習の研究は、まだアルゴリズムの開発競争の段階である。ところが、この段階を越えると、今度はデータを大量に持っているところほど有利な世界になるはずだ。そうなると、日本はおそらく海外のデータを持っている企業に太刀打ちできない。世界的なプラットフォーム企業が存在しないからだ。

IoT およびそれに伴うビックデータというもう一つのブームと合わさって「ビックデータx人工知能」は今後のテーマとなる。繰り返しだが、もしかすると生きているうちにそんな時代が来るのかもしれない。今がその転換の最中なんだろうか。

dマガジンの今後の行方は要ウオッチ

ケータイ変えたときに強制的に加入することになったドコモのdマガジンが結構いいので継続したままにしている。月額400円で雑誌160誌が読み放題のサービス(2015/11/24現在)。

結構いいというのは、きっとこういうサービスでなければ手に取ることがなかったファッション誌やグルメ雑誌をぱらぱらとめくるのが結構楽しいのと、スタッフおすすめ記事という形で提供される雑誌間をまたいだ記事の直リンクへのまとめがトレンドを知るのに便利だからだ。今だと下町ロケットとか、パリ同時多発テロ事件とかディズニー&USJ Xmas とか多くの雑誌で取り上げている特集記事を横断して読むことができる。ちょっと前は iPhone 6s 解説や福山結婚記事とか。同じネタを雑誌横断で読めるのは電子&読み放題ならでは。

リアル雑誌と比較して、電子版用に一部割愛されているが文句はないレベル*1。リアル雑誌を買っても隅から隅まで読むことはほぼのないので、気に入った記事だけを読んでゴミが残らないのはよい。

ビジネスモデルとしてはユーザーの読んだ割合に応じて出版社に配分される仕組みになっているらしい。

現在はユーザーの課金収入の55%を出版社へ配分し、雑誌あたりのユニークユーザー数(期間内の訪問者数のこと)に応じて毎月配分している
スマホで「雑誌読み放題」人気はどこまで? | 企業戦略 | 東洋経済オンライン | 新世代リーダーのためのビジネスサイト

8月で200万人とあるから、400円 x 200万 x 0.55 = 4.4億円/月。その160誌での分配だからそんなに大きな金額ではない。

システムはKADOKAWAグループで電子書籍ストアを手掛けるブックウォーカーに委託しているらしい。で、そのカドカワは儲かっているとある。カドカワは 45%側なんだろうか。

ドコモのいろんなサービスは強制加入&解約忘れで儲けているのではないかという不信感が少しあるが、400円はコストパフォーマンスがよい。今後400円がキープできるのか、儲からないということで1年後にはなくなるのか、専門誌などさらに取り込んで月額料金の高いコースをつくる方向に行くのか、割愛されたページが解除されていくのか、他の漫画読み放題などのサービスと統合したりするのか、もう少し見守りたいと思う。

*1:こちらによると約7割らしい。例えばお色気系は完全削除。一部健全なグラビアは雑誌によっては載せているものもある。

書評 - 「ついていきたい」と思われるリーダーになる51の考え方

目から鱗みたいな考え方がたくさん書かれているわけではなく、そりゃそうだという当たり前な内容が多かったというのが感想だが、逆に言うとついていきたいリーダーというのは、普通に考えて人としてそっちの方ががいいだろうということを冷静にこなしている人だと思う。論理だけでなく情も含めてそっちのほうがいいという判断。

「ついていきたい」と思われるリーダーになる51の考え方

「ついていきたい」と思われるリーダーになる51の考え方

一般に、相手を理解するというのは、プレゼンやコミュニケーションの基本だが、それにも関連すると思う以下の言葉がこの本の中では一番印象に残った。

年功序列意識も薄くなった今どきのドライの発想でいえば、「先輩だろうが、後輩だろうが、そんなことは関係ない。正しい意見を採用するべきだ」と思うかもしれません。実際、そうしたほうがいい場面もあるでしょう。しかし、そうしないほうがいい場面もあるのです。
組織に対して大きな影響力を及ぼさないような案件であれば、それは天秤にかけるべきです。先輩の顔をつぶしてでも、正しい意見にこだわって組織の雰囲気を悪くするか。それとも、組織の雰囲気を守ろうとするのか。その判断がリーダーの腕の見せどころだと思うのです。

そしてもうひとつ、重要なのはお客様の立場に立ってみる、ということです。お客様とて、「いくらです」「はい、そうですか」というわけにはいかないこともあるでしょう。「これだけ頑張りました」「これだけ値引いてもらいました」と上司に報告をしたいと思うのです。だから、社内的に言い訳が立つような理屈を作ってあげることが大切になる。相手も会社員なのです。一緒にその理由を考えてあげなさい、と。

その他、ハイライトしたことば。

まず私が心がけていたのは、自信を持って意思決定できないときは、決定のタイミングを先に延ばすことでした。つまり、「今決定しない」ということを決定する。そして、どうしてもこの時点までに決めなければいけない、という時期を確認する。
(中略)
かっこいい意思決定なんてしなくていいのです。求められているのは、正しい意思決定なのですから。

人事だけは、迷ったらやらないと決める

ぜひ、「何か、困ったことはない?」と聞いてあげてください。それは「ついていきたい」と思われる、大事な言葉のひとつだと私は思っています。

「好きなこと」「得意なこと」「人のためになること」の三つの円が重なったことをミッションにするべき、と書きました

tabi-labo.com

録画の CM 再生率は 15%

2015年11/14号 週刊ダイヤモンドの記事によると 15% とのこと。

調査では、全国1000世帯以上を対象にテレビの録画再生機に。専用のモニター機器を設置、テレビで録画再生された番組を、視聴者がどのように見ているかを詳細に探った。

しかし、ふたを開けてみれば、1時間の番組中に4回ある CM の再生率は全体の15%前後。業界内では、それまでは3割は CM を見ているとされていたものの、その半分しか実は再生されていなかったわけだ。
されに言えば、15%という数字はあくまで、録画番組を再生した世帯を分母にしている。
録画しても番組を再生していない世帯や録画すらしていない世帯を分母に含めれば、再生率はわずか2%にとどまる。

最近はすっ飛ばせないネット CM が増えてきたが、見たいものを無料で見るために見たくないものを添えるとか、それを見せないためにお金払うとか、やっぱり方向として素直じゃないと思う。

dw.diamond.ne.jp

100年生きる私たちの価値観について

本を読んだ後はその感想をネットでチェックして解釈や気付きを振り返るようにしているが、ほぼ日の対談記事を見つけた。www.1101.com

著者のリンダさんの意見がメインというよりは、糸井重里さんがリンダさんを会話を進めるうちにどんどん引き込んでいる様がメインに思えた。いろいろうまいこと言うなーと思ったのでその辺の惹かれるコメントをメモ。

糸井
やっぱり、
ひとりでできることには限界があって。
チームでないとできないことが多すぎたんです。

糸井
それはとても美しい姿勢だと思うのですが、
ぼくら日本人は
もうすこし勤勉ではない人間なんですよ。
「ここにいるのはイヤだよね」ということが、
そこから動く大きな動機になる(笑)。

リンダ
なぜわたしがこれらの本を書いたかというと、
これからは、昔とおなじ生活を送っていては
暮らせなくなってきていると思うからなんです。

糸井
もともと企業は、
そういう利益にはならないことも
当然「やること」としてきたんです。
でもいまは、
まず「儲かるか儲からないか」をスタートにおく。
そういう流行にみんなが合わせるように
なってしまったんだと思っています

糸井
それは「法人」という言葉で考えたら、
すごくわかりやすいんですよ。
英語には「法人」という言い方があるのかは
わからないのですが、
ぼくは、この言葉が表すように
やっぱり企業も「人」なんだと思うんです。
地域や人々への貢献を
当然のこととしてやっている「人格」と
利益を出すことだけを考えている「人格」とを
くらべてみたら、
人々は前者の人格に引かれていくに決まっています。

糸井
一方で、
「伝統的である」ということには案外、
いまの行きづまった状況と共通するものが
あるんじゃないかとも感じます。
つまり、
ある時代に大きな影響力を及ぼした「伝統」って、
実はじゃまものだったんじゃないかって。

書評 - ワーク・シフト ― 孤独と貧困から自由になる働き方の未来図〈2025〉

働き方が変わるってどう変わればいいのか。なぜ変わらないといけないのか。それってきれいごとじゃないのか。リスクに見合うのか。本当に正しいのか。そんな葛藤はしょっちゅうある。

ワーク・シフト ― 孤独と貧困から自由になる働き方の未来図〈2025〉

ワーク・シフト ― 孤独と貧困から自由になる働き方の未来図〈2025〉

途中で積読になっていたワークシフトを改めて読んでみた。抽象的なきれいごとだけを述べているのではなく、かといって自分に当てはまらない具体的すぎるケースばかり並んでいるわけでもなく、何というかちょうどいい。もちろん未来に決まった答えなどないし、これを読んだからと言って安心できるわけもないのだが、その一つの答えを論理的に導こうとしている非常にしっかりしたストーリー。特に8, 9, 10 章で三つのシフトをサマっている個所は、また間を開けて読み返し頭に入れておきたいと思う。おすすめです。

  • 第一のシフトは、ゼネラリストから「連続スペシャリスト」へ

昔は一つの会社に勤めるのが普通でその会社がコースを用意してくれるので、キャリアは会社任せにしておけばよかった。でもそういった企業と社会の関係が変わっていく。すると会社を熟知しているだけの会社人間には価値がなくなる。

問題は、そうした旧来の終身雇用の「契約」が崩れはじめたことだ。ゼネラリストがキャリアの途中で労働市場に放り出されるケースが増えている。そうなると、一社限定の知識や人脈と広く浅い技能をもっていても、大した役にたたない。

広く浅いゼネラリスト的な技能はネットの情報にとって代わられる。ネットのニュースたくさん読んでたくさんブックマークしてそれで人より賢くなった気になってしまうことも多いが、しょせんスポーツ新聞で芸能情報読んでる程度の暇つぶしであって、もちろん情報収集という趣味を楽しむ分には構わないがそれだけでは何も生み出さない。本書によるとゼネラリストを脱却し連続スペシャリストになる必要があると。悲しいけど近所の物知りおじさんの時代じゃないんだろう。

テクノロジーの進化とグローバル化の進展により人と人との結びつきが強まる半面、私たちはいま以上に時間に追われ、孤独を味わうようになる。

既に私の周りもそんな時間に追われている状況が増えていると思うが、そのために三種類の人的ネットワークが必要になるとのこと。

関心分野を共有する少人数のブレーン集団である「ポッセ」、多様なアイデアの源となる「ビッグアイデアクラウド」、そして安らぎと活力を与えてくれる現実世界の友人などで構成される「自己再生のコミュニティ」

  • 第三のシフトは、大量消費から「情熱を傾けられる経験」へ

働いて給料を受け取り、そのお金で消費して幸せを感じる―この古い約束事は、もはや機能しなくなっている。

お金と消費から創造と経験へ。他にもワークライフバランスダイバーシティ。いろんなところで言葉は聞くしそういう意見があるのは分かっている。でもそこには葛藤がある。

現場管理職より上に昇進することなく、ストックオプションで巨万の富を築くこともなく、よき父親として、あるいは自分の成長を重んじる人物として職業人生を終えた人物がメディアで称賛を浴びることなど、あるのでしょうか?

この本が単にきれいごとを並べただけの本ではなく共感できたのはこの部分がちゃんと書かれていた点。

<シフト>をおこなうとは、覚悟を決めて選択することだ。

すべてを環境任せにして、自分で選択することを放棄するのは簡単だが、それは、ドイツの心理学者エーリッヒ・フロムが「自由からの逃走」と呼んだ態度、すなわち会社や社会の規範に同調し、自分の個性を軽んじる態度にほかならないのかもしれない

自分と家族の充実のためにいろんなシフトが必要だと思った。

Chromecast の設定と簡単接続のポイント

Chromecast 買ってみた。Chromecast の特長は多くの TV が既に HDMI CEC による電源 On や入力切替の機能を持っていることに注目して、それをスマホからの電源 On や Chromecast への入力切替 (感覚的にはスマホあるいは YouTube への入力切替) に置き換えたことだと思う。Chromecast 対応サービスもどんどん増える気配で、数多ある単なるネット接続機器としての Android スティックは、皮肉にも Chromecast によって一瞬で駆逐されていくと思う。SDK が公開されており、例えば話題の Aereo も対応するらしい。

初期設定も簡単。「家のローカルネットワーク (Wi-Fi) に既につながっているスマホが手元にある」ことを前提にしている分シンプルになっている。さすがに Wi-Fi のパスワードだけは手動で設定しないとだめだが、そもそもどのアクセスポイントに接続するかは、隣の家の機器含めてたくさん見つかる中から選ぶのではなく、スマホが既に接続しているアクセスポイント(つまり家にあるルーター)に絞り込んでいる。次の記事の感じ。

気になったのはこの直接接続の部分スマホに Chromcast アプリを入れると Chromecast デバイスが見つかり、その Chromecast デバイスを選ぶと、スマホWi-Fi 接続が一度切れて Chromecast デバイスにダイレクトにつながる。その後 Chromecast が Wi-Fi に接続できるようになるとスマホも元のアクセスポイントへの接続に戻った。

これ DIAL (DIscovery And Launch) というプロトコルの DIAL Service Discovery という仕組みのようだ。スマホは IP address 239.255.255.250 の UDP port 1900 に対して UDP リクエストを投げる。これを受け取った Chromecast はパケットの中の LOCATION header を手掛かりに Chromecast Client (つまりスマホ) を特定する。詳しくは以下。


さまざまなユーザーのことを考え、いろいろできるようにすることと簡単設定というのは矛盾したテーマである。Chromecast もスマホを持っていない人や、スマホを持っているが Wi-Fi につないでない人を考えだしたら、スマホ持ってて既に Wi-Fi につないでいる人の設定までややこしくなる。本来はスマホの設定 + Chromecast の設定という大変なことを必要とされているわけだが、スマホの設定なんでずっと前にやっていて忘れているので、プラス Chromecast の設定だけやっているとなぜか非常に簡単に感じてしまうのは、結構重要なことだと思う。