o(np)のdiffアルゴリズムを作りました。
元ネタはこの辺。
An O(NP) sequence comparison algorithm
なんで車輪の再発明したかというと、既存のライブラリだと挙動がわからない上に、使い勝手がいまいちだからです。
自分で全部書けば、自由自在(ぉ
とりあえずリファクタリングの余地は多々ある感じですが。
一般的な意味でのdiffと違うところと言えば、追加/削除のみしか考えておらず、「置換」がありません。
けど、アルゴリズム上「置換」に当たる場合は「追加→削除」または「削除→追加」のいずれかの順番でSESの中に現れるので、その場合を「置換」と処理すればよいかと思います。
使い方とかは暇があったら書く。
このあたりを参考にさせてもらいました。日本語の解説ではこれが一番わかりがよく正確だと思います。
diff(1)
JavaScriptで文字列型から整数型への変換速度比較
http://kur.jp/2009/10/06/stringtoint-by-javascript/
というのがあって、なんかコードを見てたらなんか思うところがあったので追試してみた。
結果から言うと、だいたい傾向は一緒だった。IE用の回避コードを入れてみて気づいたけど、実行順序によって速さが変わるかもしれない。(一度読み込んだ関数は二回目は若干速い?
結果はこちら
firefox 6 6 6 119 274 IE 801 781 851 2003 1553 chrome 311 292 299 135 234
キーワード自動リンクの話を某勉強会でしました。その資料を公開します。
自動リンクのためのデータ構造としてTrieを採用し、今回は有名な実装であるsenna, Tx, dartsの比較をしました。
それぞれのライブラリの背景は次の様なデータ構造です。
今回の実験はとりあえず実装しましたレベルなので、厳密な速度や容量にはなっていない可能生があります。
というのは、それぞれのライブラリを精査したわけではないからです。
またキーワード抽出した結果がそれぞれで若干異なっています。抽出できたキーワードの件数に大きなさや検索にかかる時間に相関が無さそうなので概ね正しいと考えることにしました。
というわけで、ご参考まで。
Txでdartsのようなtraverseをする関数を作ってみました。
使い方はdartsのtraverseと同じだと思います。たまたま作ったのでパッチをそのまま貼っておきます。動作は未保証。dartsよりも爆速でふきました。
Darts: Double-ARray Trie System
http://chasen.org/~taku/software/darts/
dartsというのは、Trie木をdouble arrayで実装したライブラリです。ヘッダファイル一つだけの配布なので大変使いやすい。
今回HAT-trieを実装してみるにあたって、Trie木の部分の実装としてこれを使ってみることにしました。
しかし、サンプルが動かない・・・・!どうやらよく見るとテンプレート周りとconstを付け加えた際に、もともとのサンプルが動かなくなった模様。
なので、これを修正しました。別に大したことはしていません。
「テクノロジーが重要なんだ」
こういう人は少なくないです。工学部を今年卒業する自分としても、「テクノロジーが重要」というのはとても同意できることです。
しかし、これが一度サービスに関する議論になった時どうでしょう?
私はこういうときにいつもこういいます。
「技術的問題はほとんどの場合解決可能なので、ユーザが受けるべきメリットについてよく考えてください」
これがなかなか難しいらしいことに最近気づく。
技術者は「技術的面白さ」が「一般人の感覚から離れすぎている」ことで、ユーザのメリットを考えにくい傾向があるように感じられる。
これはよくよく指摘されていることです。
が、面白いことに「技術者じゃない人」も同じく、「技術ありきでサービスを考える」傾向がとても強いことに最近気づいた。
やっかいなのは技術に関する知識がない分、発想が貧弱だということだ。
よくgoogleが引き合いに出される。(一応特定個人のことを言ってるわけではなくて本当にそういう人が多いということです。)
だいたい理屈はこんな感じだ。
「googleにはpagerankというテクノロジーがあった。かならずイノベーションにはテクノロジーが必要なんだ」
「googleにはcloudを持つ技術があった。だからイノベーションにはテクノロジーが必要なんだ」
しかし、これをいってる人の何人がpagerankによる効用やcloudによる効用を説明できるのかはかなり疑問です。
「テクノロジーが必要」といいながら、その実「テクノロジーが本当に重要だったかどうか」については全く検討されていないように感じられる。
とくに「cloudを持つ技術がある」というあたりは、もはや末期的な発言に聞こえる。cloudに関する技術的な定義は大変あいまいで、技術がわかる人は少なくともこういう発言はしない(と、俺は少なくとも思う
私はここに「テクノロジーの神話」があるように思えてならない。
もうテクノロジーの時代は去ろうとしているということに気づかないといけない。
「サービスの時代」といわれ、先進国は三次産業にうつっているといわれて久しい昨今。「テクノロジーの発明」に固執することはおかしいのではないだろうか?
もはやほとんどの電化製品は技術の集大成であるということを認識しないといけない。webサービスはもっと多くの技術の上に成り立っている。
RDBひとつとってみたところで、技術の集大成だ。
もはやフィラメントを光らせたらそのまま製品にできるような時代はとっくの昔に終わっている。ひとつの技術がイノベーションを起こせるというのはすでに時代錯誤でしかない。
現代のテクノロジーにおいて必要なことは2つ。「市場をみること」と「多くのテクノロジーを知ること」だ。
市場を見ることで、どのようなテクノロジーが必要とされており、なにを開発するべきかを知らないといけない。
そして、市場の問題を解決するために、適切なテクノロジーを選択できなくてはいけない。
もし、現代にイノベーションが求められているというのであれば、「技術の発明」に固執してはいけない。
イノベーションは、テクノロジーの与えた経済的・社会的インパクトで計られ、しかも技術の発明がそのまま社会にインパクトを与える時代は終わってしまっているからだ。
今はむしろ、与えるべきインパクトから逆算することが求められている。与えるべきインパクトから、適切な技術を開発・選択することが求められている。
今一度真摯に「テクノロジー」「イノベーション」という言葉について考えてほしい。
本当に、あなたが考えている「pagerank」や「cloud」がイノベーションに必要だったんだろうか?むしろ、単純に「検索結果がよかったから」じゃないだろうか?
インターネットは本当にあなたの生活を変えたのだろうか?ニコニコ動画がなかったら?Amazonがなかったら?googleがなかったら?あなたはwebサービスがなくてもインターネットに感動しただろうか?
こういう言い方をしてもいいかもしれないです。あなたの「目で見たもの、耳で聞いたもの、肌で感じたもの」を信じてください。
本当にpagerankにあなたは感動したのでしょうか?メディアにだまされてそんな気がしてるだけじゃないですか?
本当にインターネットに感動したのでしょうか?今あなたの見ているものはインターネットなんですか?
重要なのは、事実がどうだとかではないです。あなたの目で見、頭で考え、そして納得したことなんでしょうか?
誰かが作った「テクノロジーの神話」に騙されてませんか?
今日の日経新聞朝刊に「科学研究 国の役割増大」という記事があって面白かったので転載。
ドイツでは、ある完了が大蔵大臣に銃を突きつけるようにして、科学研究費の獲得に勤めていた。その官僚の名前はフリートリヒ・アルトホーフという。
(中略)
彼は優れた科学上のアイディアを持ちながら、それを発展させる資金がないために困っている人物を見つけると、一存で研究費を投入して完成に導いた。あるいは優れた能力を持ちながら、なかなか教授になれないでいる人物を見つけると、大学側の反対を押し切り、教授に任命した。
そうした研究者が数年もすると、次々にノーベル賞を受賞して言った。そのため彼は後年「ノーベル賞受賞者のゴッドファーザーと呼ばれた」
(中略)
しかしその反面、アトホーフはいつまでも国家財政に頼っているのでは、限界があることを見抜いていた。彼は巨額な民間資金が科学研究に投入されている米国を横目で見ながら、それに強い危機感を抱いていた。そこでひそかに同様に仕組みをドイツに導入する計画を練り始めた。
しかし彼の企画はスムーズには進まなかった。
(中略)
アルトホーフの没後百周年にあたる2008年10月彼の人物や功績を再検討しようと、八カ国の報告者が参加した国際シンポジウムが開かれた。シンポジウムでは、今後科学研究はいかなる資金によって支えられるべきかという点に議論が集中した。
「役に立つ知識か否かは、市場によって選別される。市場から求められない研究分野が消滅するのは、当然の結果である」「科学研究にかかるコストは、その成果から直接利益を得る企業が負担すればよい」「なんらの企業利益も生まないような科学研究は支援する価値がない。」・・・・こうした発想が現代では主流となっている。
しかし学問とか科学研究は、レンガを一つ一つ積み上げてゆく作業である。一つ一つのレンガは目に見える利益を生まなくても、それがなければ知識全体がつみあがっていかない。
(中略)
この現代では新たな研究成果は、出資者の私有財産となり、他者が自由には使えないケースが増えた。
(中略)
大学予算削減が連続する時代には、第二、第三のアルトホーフもまた欠かせない。
なるほど。研究成果と企業云々の部分に関して似たようなことをドラッカーも実は書いている。
テクノロジストの条件 ドラッカー
p131
近代企業は、いわば技術の産物である。(中略)今日の大企業のルーツは、最初の大企業である19世紀半ばの鉄道、つまり当時の技術的イノベーションだった。それ以降、今日のコンピュータメーカーや製薬会社に至る成長企業のほとんどが、それぞれの時代の新技術による産物だった。
それどころか、やがて企業が新技術を生み出すようになった。(中略)技術は、イノベーションとして社会的に有効なものとなる上で、ますます企業に頼るようになった。
今日たまたま素粒子物理の友人と話していたが、「加速器一回まわすのに一千万くらいかかる」という話である。一回の実験で一千万。ひとつの研究をなすのにも世界中の企業からお金を集めなければない世界がここにある。
素粒子物理はともかくとして、実際に企業活動をベースとして技術を捕らえる事に関して、ドラッカーは「技術を予期することが肝心だ」と説く。
テクノロジストの条件 ドラッカー
p132
第一に、技術は神秘的なものでも予期できないものでもない。合理的に予期することは可能であり、そうすることが必要である。
(中略)
第二に、技術は事業活動と別種の活動ではない。そもそも事業と別のものとしてしまったら、マネージメントできない。
(中略)
技術は把握できないとする考えは、もはや時代遅れである。まさにこの考えが技術に対する恐怖をもたらす。発明は予期したり計画したりできないとする考えも、また間違いである。
(中略)
特にイノベーションについては、予期すること、計画することが重要だって、かつ必須である。
「技術を予期することが容易だというのではない」と言ってはいるが、繰り返し繰り返し、技術やイノベーションを予期することの大切さを説いている。おもしろいのは、この続き。
マネジメントが関心を持つべきものは、発明ではなくイノベーションである。イノベーションとは社会用語であり、経済用語であって技術用語ではない。(中略)イノベーションは、たとえ発明から生まれることが多くとも、発明と同義ではない。
言われてみると当たり前のことなんだけど、実はこの視点、結構かけているように感じることが多い。
正直よく「こんなことできるなんてすごい!イノベーションだ!」とか「これが開発できたら今までになかった!イノベーションだ!」ときいたりするんだけど、その経済効果とかってあまり考えられていないなぁとよく感じることが多い。
結局売れなかったものは「イノベーション」と呼ばないにもかかわらず、なぜか開発段階やコンセプトの段階で、この「経済効果」という概念を欠いているものが多いように感じることが多い。
むしろ個人的な感想としては、開発やコンセプト段階で経済効果について言及することが悪とさえ思われてるんじゃないかと思うことすらある。
また一方で、「イノベーションなんか予期できない」と言っている人がいますが、実は割りと限定的に予想することは可能だったりします。それなりの業界知識と工学知識があると、「何があたるか」はわかんなくとも「何が可能そうか」はわかるし「何が売れそうか」もなんとなくわかる。俺的に問題は「可能そう」でかつ「売れそう」なものを考えるのが案外難しい。
こっからは持論ですが、結果的に工学や科学・ソフトウェア、なんでもいいんですが、そういったものに対するそれなりに深い知見と、ある程度のマーケットへの洞察が「イノベーション」を起こすためには重要であると思っています。「それなりに深い」っていうのは難しいところですが、工学が全くわからない人は論外だけど、それほどマニアックでもないといったところであるきがします。
現に工学部の研究室の研究というのは、現代の技術のちょっとした発展を扱っているというものが多いです。結局研究もほとんどのものは従来のものに自分なりに方向付けをして付け足していると考えてもそれほど間違ってはいないと思います。これからの企業は、現代のテクノロジーの把握と、マーケットを見据えた方向付け、そして資源の集中と開発という技術とともに発展していく形というのがいいのではないかなと思います。技術の発展には企業活動による資金の供給が必要であり、企業はマーケットを見据えその方向性をコントロールすることで技術をお金に変え発展する。こういう技術に対する先見性と経営が必要なんじゃないかなと思う今日この頃でした。
常々「論理的思考」というものには辟易している。
それはよくある反論のように「論理的に考えたところでイノベーションは起こらないんだ!」とかいう抽象的な話ではない。
「論理的に考えることがいいことだ!」と言ってる人も「論理的に考えてもイノベーションなんか起こらない」とか言ってる人も、俺はどちらもたいていの場合賛同できない。
自分が言いたいのは、人間なんてそもそも論理的に物事考えてなんかいないということだ。
そう、問題は「論理的に物事を考えていない」ということ。もしくは「考えてる論理が穴だらけすぎてやばい」ということか。
と、いうのはこの記事のような内容。
http://blog.goo.ne.jp/hi_tsuka/e/c8cbf35ecc957120699cbd987635df45
ちょっとあえて小難しく論理的に考えてみよう。しばらくお付き合いを。
まず、直感的に正しいと思える次の主張はまったく間違っていることに気づかない人は存外多い。
「9回連続で赤が出る確率はXX%。。。だから、次は黒!」
普通に高校レベルの確率論をやっている人は、「8回赤が出たときに9回目に赤が出る事後確率」を計算すべきだと気づくと思う。
今回の場合、善良なディーラーであると仮定するならば、すべての試行は独立であり、結局今まで何回赤が出ようが、9回目に赤が出る確率はpで一定であり、かつ、黒が出る確率は1-p。
問題は、赤が出る確率pがどの程度かという点である。残念ながらこれは判断できそうにない。
じゃぁ赤と黒が均等に出ているのかどうかを大真面目に検定してみよう。ちょっと馬鹿馬鹿しい気もするけど二項検定してみました。
帰無仮説「赤と黒が確立1/2で出る」 → p-value=0.007812
有意水準1%だとすると、どうやら帰無仮説は棄却されそうです。つまり台はゆがんでたりなんかするかもしれない可能性がそれなりに高い。
さて、ちょっと記事の話に戻りましょう。検定方法が正しいのかとかいろいろな問題はあるんですが、どうやら記事中の社長さんと同じ結論になってしまいました。「台は壊れてるんじゃないかkk」(kk = 確率的に考えて)
結局何を言いたかったかというと、論理というのは手段なのであって、論理性と「イノベーションが起こせるかどうか」は無関係なのです。うそ。正確に言えば「関係があるかどうかはわからない」ということ。
なので、どっちを信じるかはあなた次第ですが、本当に論理的に考えてる人であるなら、関係があるともないとも言えないはずなのです。
さらにもう一歩突っ込むと、「論理的に考えることに限界がある」というのは嘘です。これってつまり、難しい数学の入試問題が解けなかったときに「これは俺の能力の限界じゃない!数学の限界なんだ!」とか言っているのと同じです。
さっきの記事で言えば、そこで「仮説検定して台が壊れているかどうかを検定してみよう」と思えるかどうかは、論理性とは別に「深く考えることができるか」だったり「知識・知恵があるかどうか」という問題なのです。
むしろ論理的思考が重要なのは、「それが正しいかどうかが検証できる」という点にあります。
たとえば今の例で行けば、検定方法は正しいのか?有意水準は1%でいいのか?いろいろな検証が可能です。
その検証可能性が、結果的に説得力にもつながっているといえるでしょう。
なぜか、この点が忘れ去られて、単純に「結果がすぐ導き出せる魔法の道具」として「論理」を考える人が多すぎる気がします。
もちろん、現実では必ず結果を出さなくてはならないため、特に論理が必要でない場では結果が優先されます。
それは別に悪いことでもいいことでもありません。ただ、論理的に考えつくすことができなかったのだとすれば、それは論理の限界ではなくあなたの能力の限界です。
これを単に「論理の限界」にすり替えるのはどうかと思います。
また、辺に自分の論理にこだわるのもいかがなものかと思います。会話していると「言葉の意味」とか「前提」とかが、自分と相手で微妙に違うことにしょっちゅう気がつきます。
もし、お互いに本当に論理的に話しているのだとすれば、相手の論理に自分の論理を写像して考えることも可能なのではないでしょうか?
もし写像できないなら、それは分かり合えないところだと思って納得しておけばいいと思います。
論理というのは道具に過ぎないということをもう一回考えてみたほうがいいんじゃないでしょうか?
なんだかわかんないけど、ロジカルシンキング(笑)だとかMECE(笑)だとかすぐに言い出す新しいおもちゃを与えられた子供みたいな人たまにいるので辟易してるのですが、論理に振り回されず、他人とちょっと楽しい会話するためのコツとして考えてみるのはどうでしょう?
iPhoneアプリで面倒なのは、プログラム的に作れるかどうかに加えてappleの審査に通るかどうかです。
それをまとめたページをtwitterからひろったのでリンクを。
なんかこのページそのものがNDA違反で消えるんじゃねぇかという予感がしないでもない。
(アプリへのリンク張ってる人は要注意だと思うなー)
http://q.hatena.ne.jp/1231517350
個人的にネックだと思ったのは、up-sellさせるような表示の禁止の部分。up-sellはマーケティング手法としては基本中の基本で、俺これ知らずに誰かにアドバイスしちゃった気がするよ・・・・嘘いってごめんなさい・・・・
3. ベータ版あるいは機能限定版の場合、以下のように reject されることがあります。
「CashFlow Free cannot be posted because it is a beta or feature-limited version. Any reference to demo or beta needs to be removed from the binary and metadata. Free or "Lite" versions are acceptable, however the application must be a fully functional app and cannot reference features that are not implemented or up-sell to the full version.」
大体の意味からすると、「アプリケーション単体の中ではすべての機能が動作しないといけません。上位バージョンや有料バージョンへの誘導をアプリの中からしないでください」という感じのようです。
いまんところiPhone関係は、本格的にフォローしてるわけではないのだけど、実際やるといろいろ大変そうだなぁ。
http://www.blu-ray.com/news/?id=2252
Finally, Panasonic has partnered with Amazon on demand to offer film downloads from Amazon's library of over 40,000 titles. This feature will be available on all new Viera-cast products.
最後に、パナソニックはアマゾンとビデオオンデマンドに関してパートナーシップを結んだ。4万タイトルを超える映画をダウンロードできるようになる。次のvieraから使えるようになる。
いまさらといえばいまさらだけど、パナソニックが積極的に外部のサービスを自社の製品に取り込むというのが進んでいます。
かくいう自分もこっそり大手電機メーカーのテレビに自社サービスを提供している会社に一時期かかわっていました。
ほかにも保険系の会社が社内のシステムの一環としてどこかの会社の事件情報(これもベンチャー)を利用するなど、そういった外部情報やサービスの積極利用が進んでいるなと一昨年の暮れから感じていました。
この傾向は今後も進んでいきそうです。