ジンブン独学ノートの実践編では、実際の研究について紹介します。研究へのモチベーションから、どのように日々の調査行われているのかまで、インタビュー形式でお届けします。
第十四回となる今回のインタビューでは、ジブンジンブンのメンバーである須河原さんにお話をうかがいます。須河原さんは一般企業に勤める傍ら、独学で苗字研究を行っています。
データで謎に挑む。「東日本の苗字はなぜ少ないのか」
——社会人になってから研究を本格化されたのが非常に興味深いです。研究を進める上で、資料はどのように集めているのでしょうか。
まず、市販されている苗字に関する本はひと通り目を通します。ただ、いわゆる通俗的な解説書よりも、歴史学者などが書いた専門的な文献を読むようにしています。もっとも、苗字を直接のテーマにした専門書は少ないので、関連分野の本から情報を拾い集めることになります。
——専門書以外にも参考にされているものはありますか?
自主研究をされている方の活動も参考にしています。例えば、「アイドルマスター」というゲームがあるのですが、登場するアイドルの出身地と苗字の関係性を論じている方がいて、その方の活動は以前から注目していました。
——ゲームがきっかけになることもあるのですね。
その方が以前指摘していたことで、私が最も興味を惹かれたのが、「東日本には苗字の種類が少ない」という事実です。これがどうしてなのか、どこを探しても明確な答えが見つからず、それが今でも私の究極のテーマになっています。
——「東日本には苗字が少ない」。それはどういうことなのでしょうか。
この謎を探るうちに、日本の農村の形態が東日本と西日本では大きく異なるという、古くから知られている事実に突き当たりました。たとえば、やや古典的な分類になってしまいますが、東日本では本家・分家といった「同族」の力が強く、西日本では家々の横のつながり、いわゆる「講組(こうぐみ)」などと呼ばれる「村中心社会」の性格が強い。こうした農村構造の違いが、苗字の分布にも関係しているのではないかと考えています。
——農村構造と苗字の関連性。そこに注目している人はまだ少ないのですか?
ほとんどいないと思います。この関係性を、統計データに基づいて理論的に明らかにしていく必要があると考えています。そして、それを可能にするのが、先ほどお話ししたデータ収集と整備なんです。
——データは主に電話帳から、ということでしたが、その整備は大変なのでは?
そうです。残念ながら、日本では苗字に関する公的なデータベースは整備されておらず、電話帳がほぼ唯一の網羅的な情報源になります。ただ、これもプライバシーの問題や、データの品質の問題があります。入力ミスによる「幽霊苗字」が存在したり、昔の文字コードの影響で正しく表示されない漢字があったりします。
こうしたデータを一つ一つ精査し、きちんとした形に整える「データクレンジング」という作業が非常に大変です。私はまず、平成の大合併前の旧市町村単位でデータを整備し、国会図書館で過去の電話帳に当たるなどして一通りデータクレンジングを行ったのですが、それだけで2年近くかかりました。
——まさに基礎となる、膨大な作業ですね。
自分で地図を作るところから始めなければなりません。その市区町村データと、現在はより小さい、大字・町丁目レベルのデータ整備を進めているところです。
——その成果を、少し見せていただくことは可能でしょうか?
遊びがてら作ったものですが…例えばこれなんかは面白いですね。「沢」のつく苗字の世帯数を地図にしたものです。長野県で「沢」がよく見られることがはっきりと分かりますね。
——これは…! 見事に分布が分かれていますね。すごい。
こういった苗字の地域差は、これまでなかなか可視化されていませんでした。元々、日本の地名では「サワ(沢)」が東日本に多く、それに対応するように西日本では「タニ(谷)」が多いと言われています。苗字もそうした地名と深く結びついていることが、この地図からも見て取れます。非常に美しい分布だと思います。
——他にも、こうした可視化の試みはありますか?
これが今の研究のメインのひとつなのですが、「HHI(ハーフィンダール・ハーシュマン指数)」というものを使って、苗字の集中度を地図にしたものです。
——HHI?
経済学で市場の寡占度を示す指数として考案されたものなのですが、これを応用しました。簡単に言うと、この指数が高いほど、特定の苗字がその地域に集中している、つまり苗字のバリエーションが少ないことを示します。これを見てみると、やはり東北地方や甲信越で指数が高くなっています。
——それは、先ほどお話しされていた「東日本の農村では同族的な結合が強い」という仮説と結びつくのでしょうか。
そう考えています。データによって、その傾向が裏付けられたのではないかと。もちろん、これはまだ仮説を可視化した段階です。
——非常に興味深いです。こうした仮説を立て、検証していくために、どのような文献や資料を参考にされているのですか?
東日本と西日本の農村共同体の違いについては、農村社会学や社会人類学の分野で研究されてきました。そうした先行研究を深く掘り下げるために、図書館をよく利用します。特に私が住んでいる隣の市の中央図書館は非常に充実していて、多くの資料を読み漁りました。
旅行先でも、その土地の中央図書館に立ち寄ることが多いですね。その地域ならではの貴重な文献に出会えることがありますから。
——足で稼ぐ面も大きいのですね。
そうですね。もっとも、最近では国会図書館のデジタルコレクションがかなり充実してきていて、市町村史やマイナーな研究書などもアクセスが非常に楽になっています。気になった本はデジコレで公開されているか調べて、すでに公開されているものはコピーを取らずにあとからPCで見直しています。
特に「小字(こあざ)」のような、より細かい単位でのデータは公開されているものがほとんどないので、地域の資料にあたる必要がありますね。
最終回は研究の具体的な内容について伺います。



