ページビューの合計

2018年8月25日土曜日

情報と知恵


情報と知恵(2

整理・構造化

  つぎは、蓄えるファイルへのデータの置き方の工夫で、検索効率を桁違いにあげる方法です。説明を分かりやすくするために、データをn個の数値データとします。はじめ、データはファイルにデータの生じた順に並べられています。いまデータの内容に着目して、これを値の小さい順に並べ直したとしましょう。

      


さて、このデータを小さい順(昇順)に並べなおしたファイルでの検索を考えます。いま、検索したい指定データを a とします。探し出したいこの a は、ファイルのどこにあるか分かりません。すなわち、探索範囲はファイルの全域のn個です。いま、この探索範囲のちょうど真中のデータの値を調べてこの数値がmであることを知ったとします。すると、ファイルのデータは昇順に並んでいるので、1回のデータの調査(検索)から次のことを知ることができます。

      a=m   のとき   運よく見つかった
             a>m   のとき   aは真中より後ろのほうにあることが分かる
      a<m   のとき   aは真中より前のほうにあることが分かる

すなわち、見つからなかったときは、調べて得た情報mと目的のaとの関係により次の探索範囲は今回の半分に縮まります。これは2分探索法と呼ばれています。n1000 の場合の2分探索法による探索範囲の縮まり方は、次のようになります。

 1000500 250 125 63 32168 4 2 1

探索範囲が1になれば見つかったことなので、2分探索法によれば1000のデータから10回の検索で必ず見つけることができるという訳です。
一般に、n個のデータから  回の検索でかならず目的のものへたどり着くことができます。この  という効率は順次に調べる方法に比べて、桁外れによいものになっています。

下の図は、2分探索において、探索範囲が急速に縮まっていくことを視覚化したものです。

 
                2分探索による範囲の縮まり方

 2分探索法の効率の良さは、探索の対象となるデータを構造化したことによるのです。バラバラであったものを目的に沿って関連付ければ、1つの情報から非常に多くの意味を取り出すことができるということです。これが相乗的に効果を生むのです。


2018年8月23日木曜日


理が紡ぎだす美 シリーズ(8

平面模様です。

   


デジタル万華鏡です。実際はこの模様が刻々変化します。




このブログを訪れられた方は、つぎのものも是非ご覧になってください。

       HP    http://dvt.oma-julius.net/
    Youtube   動視化技術研究所
     hirotonamihira
   


2018年8月15日水曜日

理が紡ぎだす美


理が紡ぎだす美 シリーズ(7

つぎは、再帰構造で秋の花をイメージしたものです。

 
  


つぎは、2か所から振動するサーチライトを照らし、交わった点を描画して形を創ったものです。

  

このブログを訪れられた方は、つぎのものも是非ご覧になってください。

       HP    http://dvt.oma-julius.net/
    Youtube   動視化技術研究所


     hirotonamihira

情報と知恵シリーズ


情報と知恵                    

 情報という言葉は、世に満ち満ちています。今の世では、その使い方は大変重要なようです。これについて、少し落ち着いて考えてみました。

 情報とは、それを知ることで今まで不確かであったことが少しでも確からしくなる知識のことですね。これを得るには、意識して捜さなければなりません。
まず、知りたいことAがあります。初めは、Aについての知識はないとします。そこで、Aについて知っていそうなC1に当たり、Aについての知識B1を得ます。これで、Aのありそうな範囲が狭まります。これを情報と呼びます。

情報処理では、情報を探り出す作業を検索といいます。これには、うまいやり方とそうでないやり方があります。

 世の中には一を聞いて十を知る英才もいれば、何度教えても学ばない御仁も居ます。ここで、一を聞いて(すなわち、一つの経験あるいは1回の調査から得た情報を理解して)これをその後の行動に生かすときの検索の効率について考えてみました。
いま、検索効率を、次のように決めましょう。

  検索効率 : 目的のものを見つけるまでの検索の回数

考えの筋道を明らかにするため次のような問題の設定をし、これを通して探索効率について考えてみました。

問題の記述
n個のデータが書き込まれたファイルがある。データの数nは分かっており、このファイルの中に探したい指定データaがあるがそれがどこにあるか知りたい。

求めるデータの探し方には、検索のためのデータの準備の仕方も含めて、効率的なものとそうでないものとがあります。その効率の測定ですが、既に定義したように、目的のものを見つけ出すまでの探索の回数で測るのが合理的です。記号として、

     T(n) : データ数nのファイルから目的のものを見つけ出す回数

としておきます。

さてこれから、賢くないやり方のほうから順にとりあげ、その効率について考えてみます。


手当たり次第に調べる方法

  まず、どう見ても賢くない方法は、n個のデータからでたらめに選ぶことを当たるまで繰り返す方法でしょう。この方法では、指定のものを見つけるのは偶然しかない。選んだものが偶然に指定のものと一致する確率は 1/nで、nが大きいときは偶然当たる確率は非常に小さい。はずれた次もまた偶然を頼りにデタラメに選ぶということは、1つを選ぶことで得た情報をつぎの探索にまったく使わないことです。したがって、効率は恐ろしく悪い。たとえて言えば、経験からまったく学ばない生き方と同じです。
“バカは死ななきゃ直らない”というやりかたです。

厳密に計算すると、n1000のときデタラメに探して1000回以内に偶然見つかる確率は0.6321です。また、99%の確率で見つけるためには、4600回程度の運を天に任せた選択の繰り返しが必要です。


経験の墨守

  前の“手当たり次第”よりは少しよい次の方法は、ファイルのデータの任意のものを選んでそれを指定のものと比べ、一致しなければそれを除いたものから次を選ぶことを繰り返す調べ方です。今確かめたデータは求めるものではないのですから、その情報を使いつぎの検索範囲を一つ狭めることができます。これを続けると調べる範囲が着実に狭くなり、ついには調べる範囲が1個になり確実に見つけることができるわけです。すなわち、最大(n-1)回調べれば確実に見つけられます。

指定のものを見つけるまでに最大n回であり、運がよければ1回で見つかることもあるので、平均はn/2回の検索で見つかるとみなせます。大雑把に言えば、データ数nとおなじオーダの検索回数で見つけられる訳です。

T(n)=n

1回の探索から得た情報の利用という観点からいえば、この方法にはもっと工夫の余地がありそうです。経験したそのものを記憶するのみで内容の意味とか理由などを考えようとせず、ただ過去に起きた同じ事を避けようとする愚直な反応によく似ていますね。

このブログを訪れられた方は、つぎのものも是非ご覧になってください。

       HP    http://dvt.oma-julius.net/
    Youtube   動視化技術研究所
     hirotonamihira

2018年8月7日火曜日

理が紡ぎだす美


理が紡ぎだす美 シリーズ(6

 風に乗ってひらひらする天女の衣をイメージしました。

  



つぎは、条件を変えたマンデルブロー集合です。

  

このブログを訪れられた方は、つぎのものも是非ご覧になってください。

       HP    http://dvt.oma-julius.net/
    Youtube   動視化技術研究所
     hirotonamihira


2018年8月2日木曜日

偏見


偏見のメカニズム                 
 
   

 
  “よく話せば互いに分かり合える”という楽観的な人生観もありうるが、私の経験ではそうは思えないこともしばしばでした。むかし日本の陸軍華やかなりしころに起きた反乱を扱った映画のある場面で、次のようなやり取りを妙に鮮明に覚えています。

    話せばわかる
    問答無用

自分はそうではないと誰しも思うのですが、人は偏見の塊です。偏見の形成を、私は次のように理由付けてみました。

人は同じ出来事を前にしても、それを自分の見たいことに沿ってみてしまう。みたいことに沿うとは、自分の慣れ親しんだものの見方・考え方に沿って出来事を解釈することです。これが偏見が出来上がる原因です。説明してみましょう。
たとえば、ある100人の集団があるとします。それは多数派のAグループ90人と少数派のBグループ10人より成っています。多数派のAはBグループに対しある偏見をもっており、Bは油断のできない輩で、その50%が盗みもやりかねない連中であると思っています。そして、自分たちについては大体正直者の集まりで、その3%程度が若干問題があると主張します。一方、少数派のBも、Aに対しこれまでの経験を誇張した独特の意見をもっています。少数派Bの見方に従えば、Aは大変嵩にかかったいやな連中で、その30%くらいはずるいやつである。そして自分たちについては、中にはいけない者も1割程度いるが、大体努力家であると信じています。

さて、この100人が連れ立って旅行に行くことになったとします。そして旅先で誰かが不用意に、“あれ、俺の財布が!”といったとしましょう。本当は自分が忘れたのかもしれない。あるいは、探せばあるのかもしれない。しかしながら、それを聞いたとたんに、Aグループは、“だから来るんじゃなかった。どうせBの仕業だ”と思います。同様に、Bグループはこれとはまったく反対の結論、すなわち、Aグループの犯行を確信します。その結果、今まで自分たちが心に描いていた‘相手に対する不信感’を互いに強めるのです。各々のグループがそのような確信にいたる道筋を説明してみましょう。

A,Bのそれぞれの言い分
もし泥棒がいたとすると、それは悪い連中に属するはずです。Aグループの見解では、悪い連中の数は、Bに属する10人の内の50%である5人と、自分たちのAに属する90人の内の3%である2.7人です。すなわち、合計7.7人です。したがって、犯人がBグループである割合は、5/7.7となります。これは相当高い率であり、日頃Bを疑っている率(先験確率)の50%より更に高い値です。そこで、この事件を契機に、Aグループは今まで懐いたBへの不信の念をさらに強めるのです。
一方、Bグループの見解によれば、悪い連中の数は、Aに属する90人の30%である27人と、自分たちのBに属する10人の10%である1人です。すなわち、合計28人です。したがって、このような見解を持つBグループからみると、犯人がAグループの者である割合は、なんと27/28となります。この値はほとんど確信に近いもので、BグループのAに対する日頃の不信感を決定付けます。
同じ出来事の解釈が、このように違うのです。
  





  

このように、双方のグループとも同一の出来事を自分のみたい方向に沿って解釈し、今までの見方を更に強めるのです。すなわち、互いに自分たちの偏見を強固にするのです。さて、偏らぬとは、難しいことですねー。


このブログを訪れられた方は、つぎのものも是非ご覧になってください。

       HP    http://dvt.oma-julius.net/
    Youtube   動視化技術研究所


     hirotonamihira