考える道筋の見える化: 8月 2018

2018年8月25日土曜日

情報と知恵

情報と知恵（2）

整理・構造化

　　つぎは、蓄えるファイルへのデータの置き方の工夫で、検索効率を桁違いにあげる方法です。説明を分かりやすくするために、データをn個の数値データとします。はじめ、データはファイルにデータの生じた順に並べられています。いまデータの内容に着目して、これを値の小さい順に並べ直したとしましょう。

さて、このデータを小さい順（昇順）に並べなおしたファイルでの検索を考えます。いま、検索したい指定データを　ａ　とします。探し出したいこの　ａ　は、ファイルのどこにあるか分かりません。すなわち、探索範囲はファイルの全域のn個です。いま、この探索範囲のちょうど真中のデータの値を調べてこの数値がmであることを知ったとします。すると、ファイルのデータは昇順に並んでいるので、1回のデータの調査（検索）から次のことを知ることができます。

　　　　　　a=m のとき　　運よく見つかった

a>m のとき　　ａは真中より後ろのほうにあることが分かる

　　　　　　a<m のとき　　ａは真中より前のほうにあることが分かる

すなわち、見つからなかったときは、調べて得た情報mと目的のaとの関係により次の探索範囲は今回の半分に縮まります。これは２分探索法と呼ばれています。n＝1000　の場合の２分探索法による探索範囲の縮まり方は、次のようになります。

　1000→ 500→　250→　125→　63→　32→ 16→ 8→　4→　2→　1

探索範囲が1になれば見つかったことなので、２分探索法によれば1000のデータから１０回の検索で必ず見つけることができるという訳です。

一般に、n個のデータから　　回の検索でかならず目的のものへたどり着くことができます。この　　という効率は順次に調べる方法に比べて、桁外れによいものになっています。

下の図は、2分探索において、探索範囲が急速に縮まっていくことを視覚化したものです。

２分探索による範囲の縮まり方

　2分探索法の効率の良さは、探索の対象となるデータを構造化したことによるのです。バラバラであったものを目的に沿って関連付ければ、１つの情報から非常に多くの意味を取り出すことができるということです。これが相乗的に効果を生むのです。

2018年8月23日木曜日

理が紡ぎだす美　シリーズ（8）

平面模様です。

デジタル万華鏡です。実際はこの模様が刻々変化します。

このブログを訪れられた方は、つぎのものも是非ご覧になってください。

　　　　　　　HP　　　　http://dvt.oma-julius.net/

　　　　Youtube　　　動視化技術研究所

　　　　　hirotonamihira

2018年8月15日水曜日

理が紡ぎだす美

理が紡ぎだす美　シリーズ（7）

つぎは、再帰構造で秋の花をイメージしたものです。

つぎは、２か所から振動するサーチライトを照らし、交わった点を描画して形を創ったものです。

このブログを訪れられた方は、つぎのものも是非ご覧になってください。

　　　　　　　HP　　　　http://dvt.oma-julius.net/

　　　　Youtube　　　動視化技術研究所

　　　　　hirotonamihira

情報と知恵シリーズ

情報と知恵　　　　　　　　　　　　　　　　　　　　

　情報という言葉は、世に満ち満ちています。今の世では、その使い方は大変重要なようです。これについて、少し落ち着いて考えてみました。

　情報とは、それを知ることで今まで不確かであったことが少しでも確からしくなる知識のことですね。これを得るには、意識して捜さなければなりません。

まず、知りたいことAがあります。初めは、Aについての知識はないとします。そこで、Aについて知っていそうなC1に当たり、Aについての知識B1を得ます。これで、Aのありそうな範囲が狭まります。これを情報と呼びます。

情報処理では、情報を探り出す作業を検索といいます。これには、うまいやり方とそうでないやり方があります。

　世の中には一を聞いて十を知る英才もいれば、何度教えても学ばない御仁も居ます。ここで、一を聞いて（すなわち、一つの経験あるいは1回の調査から得た情報を理解して）これをその後の行動に生かすときの検索の効率について考えてみました。

いま、検索効率を、次のように決めましょう。

　　検索効率　：　目的のものを見つけるまでの検索の回数

考えの筋道を明らかにするため次のような問題の設定をし、これを通して探索効率について考えてみました。

問題の記述

「n個のデータが書き込まれたファイルがある。データの数nは分かっており､このファイルの中に探したい指定データａがあるがそれがどこにあるか知りたい。

求めるデータの探し方には、検索のためのデータの準備の仕方も含めて、効率的なものとそうでないものとがあります。その効率の測定ですが、既に定義したように、目的のものを見つけ出すまでの探索の回数で測るのが合理的です。記号として、

　　　　 T(n)　：　データ数ｎのファイルから目的のものを見つけ出す回数

としておきます。

さてこれから、賢くないやり方のほうから順にとりあげ、その効率について考えてみます。

手当たり次第に調べる方法

　　まず、どう見ても賢くない方法は、n個のデータからでたらめに選ぶことを当たるまで繰り返す方法でしょう。この方法では、指定のものを見つけるのは偶然しかない。選んだものが偶然に指定のものと一致する確率は　1/nで、nが大きいときは偶然当たる確率は非常に小さい。はずれた次もまた偶然を頼りにデタラメに選ぶということは、１つを選ぶことで得た情報をつぎの探索にまったく使わないことです。したがって、効率は恐ろしく悪い。たとえて言えば、経験からまったく学ばない生き方と同じです。

“バカは死ななきゃ直らない”というやりかたです。

厳密に計算すると、n＝1000のときデタラメに探して1000回以内に偶然見つかる確率は0.6321です。また、99％の確率で見つけるためには、4600回程度の運を天に任せた選択の繰り返しが必要です。

経験の墨守

　　前の“手当たり次第”よりは少しよい次の方法は、ファイルのデータの任意のものを選んでそれを指定のものと比べ、一致しなければそれを除いたものから次を選ぶことを繰り返す調べ方です。今確かめたデータは求めるものではないのですから、その情報を使いつぎの検索範囲を一つ狭めることができます。これを続けると調べる範囲が着実に狭くなり、ついには調べる範囲が１個になり確実に見つけることができるわけです。すなわち、最大(n-1)回調べれば確実に見つけられます。

指定のものを見つけるまでに最大n回であり、運がよければ1回で見つかることもあるので、平均はn/2回の検索で見つかるとみなせます。大雑把に言えば、データ数nとおなじオーダの検索回数で見つけられる訳です。

T(n)=n

1回の探索から得た情報の利用という観点からいえば、この方法にはもっと工夫の余地がありそうです。経験したそのものを記憶するのみで内容の意味とか理由などを考えようとせず、ただ過去に起きた同じ事を避けようとする愚直な反応によく似ていますね。

このブログを訪れられた方は、つぎのものも是非ご覧になってください。

　　　　　　　HP　　　　http://dvt.oma-julius.net/

　　　　Youtube　　　動視化技術研究所

　　　　　hirotonamihira

2018年8月7日火曜日

理が紡ぎだす美

理が紡ぎだす美　シリーズ（6）

　風に乗ってひらひらする天女の衣をイメージしました。

つぎは、条件を変えたマンデルブロー集合です。

このブログを訪れられた方は、つぎのものも是非ご覧になってください。

　　　　　　　HP　　　　http://dvt.oma-julius.net/

　　　　Youtube　　　動視化技術研究所

　　　　　hirotonamihira

2018年8月2日木曜日

偏見

偏見のメカニズム　　　　　　　　　　　　　　　　　

“よく話せば互いに分かり合える”という楽観的な人生観もありうるが、私の経験ではそうは思えないこともしばしばでした。むかし日本の陸軍華やかなりしころに起きた反乱を扱った映画のある場面で、次のようなやり取りを妙に鮮明に覚えています。

　　　　話せばわかる

　　　　問答無用

自分はそうではないと誰しも思うのですが、人は偏見の塊です。偏見の形成を、私は次のように理由付けてみました。

人は同じ出来事を前にしても、それを自分の見たいことに沿ってみてしまう。みたいことに沿うとは、自分の慣れ親しんだものの見方・考え方に沿って出来事を解釈することです。これが偏見が出来上がる原因です。説明してみましょう。

たとえば、ある１００人の集団があるとします。それは多数派のＡグループ９０人と少数派のＢグループ１０人より成っています。多数派のＡはＢグループに対しある偏見をもっており、Ｂは油断のできない輩で、その５０％が盗みもやりかねない連中であると思っています。そして、自分たちについては大体正直者の集まりで、その３％程度が若干問題があると主張します。一方、少数派のＢも、Ａに対しこれまでの経験を誇張した独特の意見をもっています。少数派Ｂの見方に従えば、Ａは大変嵩にかかったいやな連中で、その３０％くらいはずるいやつである。そして自分たちについては、中にはいけない者も１割程度いるが、大体努力家であると信じています。

さて、この１００人が連れ立って旅行に行くことになったとします。そして旅先で誰かが不用意に、“あれ、俺の財布が！”といったとしましょう。本当は自分が忘れたのかもしれない。あるいは、探せばあるのかもしれない。しかしながら、それを聞いたとたんに、Ａグループは、“だから来るんじゃなかった。どうせＢの仕業だ”と思います。同様に、Ｂグループはこれとはまったく反対の結論、すなわち、Ａグループの犯行を確信します。その結果、今まで自分たちが心に描いていた‘相手に対する不信感’を互いに強めるのです。各々のグループがそのような確信にいたる道筋を説明してみましょう。

A,Bのそれぞれの言い分

もし泥棒がいたとすると、それは悪い連中に属するはずです。Ａグループの見解では、悪い連中の数は、Ｂに属する10人の内の50％である５人と、自分たちのＡに属する90人の内の３％である2.7人です。すなわち、合計7.7人です。したがって、犯人がＢグループである割合は、5/7.7となります。これは相当高い率であり、日頃Ｂを疑っている率（先験確率）の50％より更に高い値です。そこで、この事件を契機に、Ａグループは今まで懐いたＢへの不信の念をさらに強めるのです。

一方、Ｂグループの見解によれば、悪い連中の数は、Ａに属する90人の30％である27人と、自分たちのＢに属する10人の10％である１人です。すなわち、合計28人です。したがって、このような見解を持つＢグループからみると、犯人がＡグループの者である割合は、なんと27/28となります。この値はほとんど確信に近いもので、ＢグループのＡに対する日頃の不信感を決定付けます。

同じ出来事の解釈が、このように違うのです。