まさおレポート

ー当ブログへようこそ。広範囲を記事にしていますので左のカテゴリー分類から入ると便利ですー

NTTデータ草創期メモランダム8 電話帳・番号案内システム

2015年12月16日 11時53分38秒 | 回想のNTTデータ 新電電 来るべき通信事業

 

 

電話帳をCTSで

電話帳がCTSで発行することになった。それまでは全国で8か所あった電話印刷会社、例えば近畿電話印刷などで活版職人が鉛活字を拾って原版を組み、写植フィルムを版下として作成し印刷機に回すという工程を踏んでいた。

電話印刷会社に打ち合わせに赴くと熟年の活版工が鉛に染まったエプロンがけをして鉛活字を木枠で囲ったボードからピンセットで拾っていた。平均年齢は50代を優に越えていたのではないか。

1967年ごろから新聞で電算写植システムが導入され始めていて、1970年代終わりには電電公社の電話帳もCTSで作成する方針が固まり1980年代初めに稼働が始まった。

ここでCTSは(Computer Typesetting System)であり(Cold Type System)でもある。溶融金属活字を使う「ホットタイプ・システム」に対して、写植システムでは文字版下を作成するのでコールドタイプだからである。

電話帳編集システムは、加入者の氏名、電話番号、住所等の個々の加入者ごとのデータから電話帳の印刷原稿版下を作成する。電話帳編集システム開発の第一フェーズではシステム開発とは言いながら、コンピュータソフトの開発よりもむしろ電話帳編集全体を満足なレベルに仕上げるための核となる電子写植機や日本語入力装置などのハードウェアの開発と電話帳に使用される文字の調査に全力を挙げていた。

案内簿の発行

電話帳の発行と並んで案内簿と呼ばれる電電公社社内の案内台で使用される電話帳の発行も重要な印刷物だった。104でコールされると全国各地にある案内台の各デスクの棚には案内簿と呼ばれる数十分冊にも分けられた印刷物が並んでいた。それを参照しながら電話番号案内を行う。従い電話帳が1年半に一回の更新および発行とすれば案内簿は毎週常に最新に更新されていなければならない。後にこれも電話帳システムの展開である電子番号案内システムに移行することになり、案内簿の役割は終わる。

電子写植機
初期の電話帳システムでは電話帳版下と呼ばれるフィルム=電話帳各ページをポジで透明フィルムに印刷した原版を作成する装置=電子写植機を開発することに装置開発の力点が置かれていた。活字並とまではいかないが、専門家がみて納得できるレベルの美しさであることが要求された。しかも文字の大きさは5.5ポイントと大変小さい。欧米ではすでにこうした第三世代の電子写植機が1972年から開発されていたが日本では文字の複雑さと多種類のために開発が遅れた。

この電子写植機の開発はNTTデータ通信本部と富士通が担当した。電子写植機はフィルムに文字をトナーで静電吸着させる仕組みで、今ではコピー機でもかなりの版下ができるようになったが、当時はCRT方式で文字の形に光を当てトナーを吸着させる方式であり相当の物理的精度が必要であった。そのため頑丈さが要求されかなり大きな装置が必要であった。1*2*3メートル程度の大きさがあったと記憶している。(その電子写植装置がようやく工場レベルでの完成をみたとの報告を受けて富士通・明石工場までその出来具合を見学に行った記憶があるがおそらく海外の写植機を日本語向けに改良したのだろう)

この装置の開発ポイントはいかに活字に肉薄できる版下ができるかで、当時の製本業界の専門家からみれば電子版下などは活字製本の美しさからみれば足元にもよれないレベルであった。富士通側は電話帳版下に要求される5.5ポイントサイズ(1ポイント≒0.3514mm幅)を美しく仕上げるため、光学的メカの部分に相当苦労していた。結果的にはあの虫眼鏡で見ないといけないほどの電話帳文字を富士通の努力で開発することに成功した。

漢字入力装置
もう一つのハードウェア開発は漢字入力装置で、当時日本語の入力をどのような方式にするのがベストかで日本中で議論があった。今でこそパソコンのローマ字変換入力が当たり前になっているが、当時は専門的に入力するには日本文字一文字に2ストローク必要だということで入力速度に問題があると言う批判があった。実際にベテランの漢字入力者のほうがワープロ入力より速かった。しかも日本語変換のソフトが当時まだ不十分で誤変換の訂正にも時間を取られた。そうした事情があり当時の漢字タイプライターに近い方式が採用された。今でこそ絶滅したが漢字和文タイプライターを使える技能者は職業訓練所で教えていることもあり、当時かなり一般的な入力方法であった。

この入力版のどの位置にどの漢字を配列するかで入力速度に影響がでるため、かなりの研究時間を配置に取っていた。利用頻度の高い文字約3000文字を打ちやすい位置ブロックに収容するために電話帳に収録されている漢字の頻出度を全文字調査するということを実施していた。電話帳に収容されている3千万か4千万人の人名と使用される文字の調査であった。広い意味でのシステム開発には違いないのだが多数のスタッフが電話帳の文字を諸橋大漢和を座右において黙々と調査している姿は国語研究所の趣であった。

漢字廃止論も
1970年代後半、コンピュータに漢字を含む日本語・記録させることについて、多くの議論があり、今からは想像がつかない程の揺籃期であった。このことを示すある一つの論文がある。当時の国立国語研究所のある研究員が論文を発表していた。それによると日本語をコンピュータに記録するには倍の記憶容量を要し、今後の発展のハンディになる。従い日本語はすべて英語に改めよという過激な内容であった。梅棹忠夫氏の日本語ローマ字化提唱に匹敵するほどの大胆な提案をまじめに行っていた。

今では記憶容量もキロからテラになろうとしており日本文字が2バイト必要とすることなど誰も気にしないし、ましてそのために日本語がハンディになるなど考えも及ばないが、記憶容量が国の産業全体の足を将来引っ張るかの心配をする時代もあったのだ。当時は日本語とコンピュータに関してはあらゆることが新鮮な調査・研究・開発のテーマになり得た。

姓名と漢字調査

当時はほとんどの人が電話帳に姓名を掲載していた。従い電話帳掲載の姓名と使用文字・特殊な読み方=難読姓を調べることは国語研究上のかなり貴重な資料になり得た。当時でも人名に関する辞典や研究書はあったがここまで網羅的にほぼ全日本人について調べたことは無いと思う。その意味で調査は極めて貴重な生産物なのだが、おそらく保存されていないだろうと思う。当時の青焼き資料がどこかにあればNTTデータで製本して出版するかそれがかなえられなければ国立国語研究所に寄贈する方法もあったのだが。

電話帳・姓名の配列順

電話帳編集システムで苦労したのが配列順の問題だ。配列など読み仮名のソートキーでソートすればなにも問題ないのではと考える方が大半だろう。いやごく少数の方を除けばほとんどすべてと言っていいかも知れない。電話帳の姓名の配列順番をじっくり眺めると単なる読み仮名だけでソートした者では無いことがわかってくる。もっとも昨今では電話帳の登録も減り、電話帳そのものの意義も変わってきているのでその配列についてことさら書き記しておくこともあまり意味のないことかも知れないと考えていたが、それでも心の隅ではせっかく苦労して開発したソートキーの説明をどこかに残しておきたいとの思いはあった。

聖職と生殖がごちゃ混ぜ
一橋大学附属図書館報 “鐘” No.7 1981年5月20日発行に日本語の分かち書きについて法則が確立されていないとの記事がある。これは電話帳配列についての難しさを代弁してくれている。

以下引用です。
日本語には分かち書きの法則が確立されておらず,単語においてもはっきりしないものが多い。中略
聖書--聖書講座--生殖--聖書物語--清少納言--聖書年代記--青少年--……--聖書における人間と社会。以上のような配列に対し,図書館測も利用者の方も多少の抵抗を感じながら規則に従っているのが現状である。
 中略
私は本館の和書目録カードはカナによる五十音順文学別配列とすべきであると考えている。中略 電話帳式配列と言った方が手っとり早い。中略 電話帳の配列原則は,漢字1字1字を1つの語と考える語順配列である。電話帳方式は漢字カナ混り文を原則とする日本語の配列に最も適したもので,図書館は謙虚にこれを検討し取り入れる必要があろう。後略

引用終わり

この記事によるとほとんどの図書館の目録は、例えば聖書関連の図書を検索しようとすると
聖書--聖書講座--生殖--聖書物語--清少納言--聖書年代記--青少年--……--聖書における人間と社会

と出てくる。「図書館測も利用者の方も多少の抵抗を感じながら規則に従っているのが現状である。」はもっともなことだ。聖職と生殖がごちゃ混ぜに配列されているのは違和感があるだろう。欧米では語単位で分かち書き=スペースを空けることが出来ているのでこのような問題は生じない。

図書館のように公共的でかつ小学生から大学生にいたるまで、又社会人に鳴ってからも人々の日常に親しんでいるところでの目録システムだ。又、図書館情報学の分野もあるくらい研究が進んでいるように見えても実は電話帳配列の方が日本語の配列にかなっているとは面白い現象だと今更ながら感心する。この記事は1981年とあるので、まさしくその頃電話帳編集システムの開発を行っていた頃の問題提起だ。同じ悩みをもつ分野が同時期に存在していたのだ。

電話帳配列の特殊性
いずれにしても電話帳配列の特殊性がわかり、それをソートキーで実現しようとしたが、これが一筋縄ではいかない。何が問題であったかを列挙してみると。
1. 姓と名が分かち書きされている。
2. 漢字別に分かち書きされている。
3. 姓と名が分かち書きと漢字別に分かち書きがネスト構造になっている。
4. 特殊な読み方をし、漢字毎の分かち書きが難しいケースがある。例 小鳥遊と書いて たかなし とよぶ姓がある。この場合、読みと漢字の対応が困難。他には石動と書いて いするぎ とよぶケースがある。

ソートキー作成で苦労
これを実現するためにはどんなソートキーを作成すればよいのか考えたがなかなかうまくいかない。ある日、ベッドの中で、実際に分類している人の手作業通りにやればいいのだと気がついた。頭の中で作業している状況を思い浮かべ、分類箱に整理していく順番にキーを作ればよいのだと気がついた。その結果懸案の電話帳配列が実現できた。
これを東北大学キャンパス内で行われた情報処理学会で1980年代に発表したのだが、恐らく図書館関係者の目にはとまっていないだろう。当時はネット検索など夢にも思わなかった頃だから。ひょっとしたら今からでも参考にしてもらえれば役に立つかも知れない。あるいはもう既に図書館の索引システムはそうなっているのかもしれない。

46年前のコンピュータ室はこんな風だった。

回想のNTTデータ

コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 記憶の断片 盗みの現場 | トップ | 回想の孫正義 インサイダー... »

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

回想のNTTデータ 新電電 来るべき通信事業」カテゴリの最新記事