2014-06-23

生物と無生物のあいだ 福岡伸一

生物と無生物のあいだ (2007) 講談社新書
福岡伸一
生物と無生物のあいだ (講談社現代新書)


何年か前に話題になった本
時間にゆとりができたので読んでみる

この本で福岡さんは、サントリー学芸賞をもらい、一躍、知識人の仲間入りをした感がある。親しみやすい題名に反して、テーマそのものは、そこはかとない奥深さを含む。題名の妙が、ヒットにつながった要因かもしれない。

前半は気軽に読める

DNSの正体に迫ったエイブリー、DNAの構造を明らかにしノーベル賞を受賞したワトソンとクリック、そしてDNA構造にエックス線回折を使って迫ったフランクリンなど、何が生物の根幹を担う物質であるかに迫った、言い換えればDNA探索の初期の研究史を、自分の留学時代の苦悩と思い出とともにつづっている。

後半は、DNAとは、どのような機能を果たしているか?ということを、ロックフェラーとハーバードで彼が取り組んだ研究に基づいて紹介する。細かい記述が続き、素人にとっては正直読みづらい。

福岡さんの研究は、最初、細胞レベルで成功し、特定の遺伝子が働かないノックアウトマウスに移行した。ところが、あと一歩のところで実験は失敗する。特定の遺伝子が働かないマウスは、なんらかの機能不全が起きるはずだった。しかし、マウスは、福岡さんが特定遺伝子ををノックアウトしても、相変わらず正常=健康に生涯を全うしてしまった。

無生物=機械ならば、そうはいかないはずだ。機械は、1つでも部品が壊れると、正常に動かなくなる。では、なぜ、特定の機能が働かない遺伝子を持つマウスは、正常に生きられたのか?

じつは、遺伝子とは、それが多少異常でも、異常を補完するシステムが、遺伝子そのものに無駄や重複のという形で備わっている、というのが彼の実験結果の含意だった。そして、それこそが、生物と無生物=機械の境となる。だからこそ、生物は、何万年、何億年もの間、地球環境の変化に耐えながら、生命は自身の命を紡ぐことができたし、この柔軟さ、言い換えると動的な均衡こそが、生命の本質に他ならない。

1回読んだだけでは、なにが大事かわからなかった。しかし、養老さんの解説を読んで合点がいった。オチに一直線に向かっていくのは素晴らしいの一言。だけど、マニアックな内容に深い入りして、読ませたい内容が伝わりづらいのが難点なのかもしれない、偉そうだけどね。

サントリー学芸賞 社会風俗部門 選評
養老 孟司(東京大学名誉教授)




2014-06-18

商売の邪魔です

ちきりんのブログは、いつもエキセントリックで、いつもインスパイアされてしまいます。で、今日のネタはこれ


Chikirinの日記

最初から分析目的があって収集されたデータは、性別、年齢、買った商品、時刻・・・といったふうに、あらかじめ決められた特定項目について整然と情報が集められます。なので収集された後、そのままデータベースソフトに格納できます。

しかし、あらたに蓄積(注目)されるようになった(ビッグ)データは構造化されていません。

(中略)

人間は「自分の専門分野をいくつか決め、その分野に関する知識や経験を学び」、「それに基づいて仮説をたて、それを検証するためにデータを分析」しますが、A I はデータの分析を通してあらゆる分野の(=特定の分野に限定せず)新知識をどんどん獲得し、その知識を分野横断的に使った分析をする。

(中略)

「構造化されたデータを、特定分野の知識や経験をもつ人が仮説をたてて分析する」という、人間のやり方では不可能だったことが可能になり、これからは、人間の思考では思いもつかないようなあっと驚く法則性やトレンドが明らかにされるのかも。

(省略)


いつも同じようなことを書いている気もするが、心の声なので気にしないでくだされ
で、思ったこと。

1. 構造化されていないデータとは、構造化する前のデータではないのか?


構造化したデータ、つまりRDBのテーブルに入るデータとは、なにが重要な要因かわかったから構造化することができたのだと思う。逆に考えると、重要な要因がわからないと、分析のためにデータを構造化することはできない。つまり、非構造化データとは、単に、海のものとも山のものとも分からないデータだから、構造化できていないのであり、もし非構造化データの中に重要な事実が存在するならば、構造化できるようにデータを整理する必要がある、と思う。そして、機械学習は、データを構造化するためのツールとして使うなら共感できるけど、非構造化データから、使えるインサイトがいきなりでてくるとは、ちょっと想像できない。

2. 構造化されていないデータだから、重要な事実がかくされてるのか?

まあ、だれも手を付けていないものの中に重要なものがあるかもしれないというのは、そうかもしれない。けど、逆に、手を付けてもどうしようもなさそうなデータだから、だれも手を付けないだけなのかもしれない。あるいは、分析するためにデータを整理するために莫大な時間がかかりそうだけど、何が出てきそうか全く想像がつかないから、何もしないのかもしれない。機械学種は、効いている要因をおおざっぱに計算してくれるかもしれないけど、本当に知りたいその先のインサイトは、ちょっと無理なのではないか。なんとなく、機械学習の結果は、人の理解度まで考慮すると、結局のところ、性年齢あたりになる気がしなくもない。

3. 機械学習で非構造化データを分析すると、重要なインサイトがでてくるのか?

面白い事実とは、おかれた立場や考え方により、かなり違うのではないか?とよくおもう。機械学習は何か出すかもしれないが、それはインサイトの利用者の興味関心とは全く別の(AICやBICのような)事情で、結論を出す気がする。あるいは、機械学習で膨大なデータを分析した結果、体験的な事実を上書きするような事実をだすかもしれない(悪いことではない)。因子・主成分・クラスタ分析をやることと、分析者やインサイト利用者にとって重要だったり興味深い事象が出ることは、基本的に関係ないし、むしろ、経験豊かなマーケターの感覚と多変量の分析結果とはよく似ていることが多い気がする。

4. 簡単に言うと商売の邪魔なんです

チキリンのようなことを誰かが言いまくると、会社の中で、真に受ける人がいて迷惑なんです。煮ても焼いても食えないようなデータや事実でさえ、データ分析すると、なにか素晴らしいお宝が出てくると勘違いする人がいるわけですよ。まずいラーメン屋の理論でいくと、ほとんどの人(99%)がマズイとおもうラーメンを、おいしいと思える奇特な人をデータ分析して探してこいといったことなのですが、まずはラーメンをおいしくしてくださいとお願いするばかりなのでございます。

まあ、自分のような三流アナリストは、ビッグデータ祭りで、すばらしい実績をあげることはできなさそうです。

以上、おわり

ネガティブな

今日、まずいラーメン屋の理論について、思いをめぐらすことがあった。
理論というか、別に理論でも何でもないんだけど、とある日、流行らないまずいラーメン屋の言い訳はたいてい決まってることに気が付いた。それが、何かといえば、

「俺の味を理解できる客がいない」

というように、客の舌や味覚を疑うのである
そりゃ理解できるわけない、だってほとんどの人はマズイと思っているんだもん。
ということで、簡単にいえば、まずいラーメン屋は、商売がうまくいかないのを他人のせいにしているから、ラーメンもまずいまんまなのだろうと思う。

同じようなパターンで、(客が来ないのは)立地が悪いからだ、というのもある
まあどちらも本質的には変わりがなくて、儲からないのは、自分の腕や接客が悪いのではなくて、自分以外の要因が悪さしているというわけだ

で、なんでこんなことを思ったことかといえば、

「売り上げが上がらないのは、買ってもらう客の選び方が悪いからだ」

といったようなことを言わることがあるからだ
なんでも人のせいにする人に、物事をうまく運べる人はいないとを信じてる

---------------

どうでもいいけど、この間、ひょっとして、自分は極端にネガティブではないのか?と思うことがあった。まあ、ネガティブだとは思っていたけど、そこまでではないはずと思って生きてきた

だけど、よく考えると、過去の記憶の中で楽しかったと思えるものは極めて少ない。
というか、あったはずだけど、すぐには思い出せない
思いしやすいことといえば、恨みつらみばかりだ。
最近は、だいぶ忘れた(忘れるように努めている)けど、ほんの少し前は、幼いの時のいやな思いで(理不尽に怒られたなどは特に)が、決して頭から離れることがなかった。

だから、いつも恨みつらみばかりが頭の中を駆け巡っているし、これが続くと気分的に、本当に死にたくなるくらい辛いことが多い、ということに、最近ようやく気がついた。市販薬で、気分が楽になるものもあるので、それに頼ることも多い。本質的に、人嫌いだと思う。

ということで、相変わらずネガティブさ満開な夜
薬飲んでねよっと

2014-06-02

諦観2

事業部の存続が危ぶまれている、簡単に言えば赤字なのにもかかわらず、担当取締役が平然と、ビジネスクラスで、海外出張する
しかも、そのことを臆面もなく、一般社員の前で、自慢げに言い放つ

その取締役は、売り上げが足らないと怒り、在庫がかさむと怒り、社員の残業が多いと怒り、仕事のクオリティーが低いと怒る。妥協や調整、言い換えればマネージメントという言葉など、この世には存在しない。

理不尽と矛盾、無理と無茶しか起こらない
本当に困ったもんだというより、もうどうでもいい毎日