高市首相の政治資金も丸見え…東大卒コンサルが作った「全国会議員検索DB」がすごい【衆院選2026】 | Business Insider Japan

一般公開された「政治資金収支報告書データベース」。
一般公開された「政治資金収支報告書データベース」。
撮影:樋口隆充

1月27日、第51回衆議院議員総選挙が公示され、2月8日の投開票に向け、各地で選挙戦が始まった。

論点はさまざまあるが、選挙公報や政見放送とともに全国会議員の飲食費や交際費、寄付金額を可視化した「政治資金収支報告書データベース」(以下、同データベース)は、選挙戦に異なる視点を与えてくれる。

高市早苗首相の政治資金の状況。
高市早苗首相の政治資金の状況。
撮影:樋口隆充

開発したのはコンサルティングファームやベンチャー企業での勤務経験を持つ西田尚史さん。どのようにこのデータベースが作られているのか。西田さん本人に取材し、取り組みの狙いや今後の展望を聞いた。

取材に応じた西田さん。
取材に応じた西田さん。
撮影:樋口隆充

※本記事は、2025年7月17日に初出した記事の再掲です。肩書きや政党名は当時のままです。

全国会議員の収支実態を可視化

この記事を読む前に、スマホで「政治資金収支報告書データベース」を開いて、いま気になる政治家の名前を入れてみてほしい。例えば、「石破茂」首相(当時)の名前で検索すると、即座に収入5376万円、支出5142万円と表示される。

石破茂首相の政治資金の収支状況。
石破茂首相の政治資金の収支状況。
Business Insider Japan

リンク先の資料を見ると、収入最多は「石破茂政経懇話会」という政治団体が2023年10月にホテルニューオータニ(東京都千代田区)で開催した「石破茂セミナー2023」の2944万円とわかる。リンク先のPDFファイルをみると、セミナー開催の会場代として364万1000円がホテル側には支払われていた ── こんなことが即座に分かるのが興味深いところだ。

「石破茂セミナー2023」の収入は2944万円。会場代としてホテル側に約360万円が支払われた。
「石破茂セミナー2023」の収入は2944万円。会場代としてホテル側に約360万円が支払われた。
Business Insider Japan

同データベースは、国会議員全713人の収支を可視化したWebサービスで、情報源となるのは、総務省が公開している政治資金収支報告書。最新の2023年度分のPDFファイルを基に独自開発のツールなどを用いて構築した。検索窓で議員名や企業名を検索すると、先ほどのように最新の収支状況を閲覧できる。

総務省が公開している報告書をベースにデータベースを構築している。
総務省が公開している報告書をベースにデータベースを構築している。
撮影:樋口隆充

政治家個人の収支だけでなく、政党単位での収支も検索できるようになっている。例えば、「自由民主党本部」と検索すると、収入総額が225億6066万円(前年度の繰越金を含むと440億円)、支出総額が180億293万円と出る。「政治活動費」「宣伝事業費」を選択し、検索すると自民党本部が2023年度に総額2億円余りを広告大手の電通に支払っていることも分かる。

同様に野党第一党の立憲民主党(当時)もみると、収入総額80億3825万円(前年度の繰越金を含めると106億2432万円)、支出総額73億5038万円だ。「広告費」として博報堂に約16億円(2023年度)を支払っていることも分かる。

AI活用の独自OCRで報告書をテキスト化

同データベースに取り組み始めたのは約5年ほど前のこと。西田さんが当時通っていた、大企業のリーダー養成などを目指して設立された専門職大学院「至善館」(東京都中央区)のMBAプログラム在籍中の授業課題をきっかけに制作を始めた。

西田さんによると、同様のサービスは10年ほど前にも存在したが、ある団体が助成金を用いて制作したところ、資金難によって短期間でプロジェクトが終了したという。

データベース作成のきっかけについて語る西田さん。
データベース作成のきっかけについて語る西田さん。
撮影:樋口隆充

制作の参考にしようと、その団体に当時の話を聞きにいくと「うちがやってすぐに多額の資金が溶けるのだから、あなたにできるとは思えない」という言葉が返ってきた。だが、それが逆に西田さんの心に火をつけた。

「当時から10年も経過し、技術的な進展もある。『できない』といわれたからこそやりたくなった」(西田さん)

“先人たち”の資金面での持続可能性という課題を克服するべく、少人数で取り組むとともに、可能な限りテクノロジーを活用した。

同データベースの大半を支えているのはOCR(光学文字認識)だ。ページ数にすると、2023年度分で計6万ページにも及ぶ政治資金収支報告書のPDFファイルをOCRで読み込み、テキスト情報をスプレッドシートに自動反映。そのデータを用いてデータベースを構築する──という流れで作成されている。

ただ、単純なOCR処理でデータ化できるようなものではない、とも西田さんは言う。

報告書の様式が統一されておらず、PCで作成する議員もいれば、手書きで作成する議員もいる。そのため、単に既存のOCRを使うだけでは正確には読み込めないのだ。そこで、AIを組み合わせ、報告書の読み込みに特化した独自のOCRの仕組みを開発した。

「Google Colab」上にある、自社開発したOCRシステムのコードの一部。
「Google Colab」上にある、自社開発したOCRシステムのコードの一部。
撮影:樋口隆充

過去5年の活動の中で、OCRが誤読しやすい用語などを学習させたAIによって「手書き」か「PCで作成したものか」を判別し、情報をスプレッドシートに反映していく。判別できない情報があればマーキングし、目視による最終チェック時に集中チェックできるようにしている。

西田さんは「専用OCRで読み込むことで、9割くらいの情報は正しく反映されるくらいにまで精度は上がってきている。OCRのソリューションも日進月歩で進化しているので、都度チューニングしている」と語る。

同データベースには、

(1)政治家の収支の流れの実態を可視化

(2)企業名や品目名でも検索可能(「うなぎ」「焼肉」なども可)

という大きく2つの特徴がある。中でも(1)に関しては、複数ある政治家の政治団体の情報を統合。講演会収入など同一議員の資金管理団体と政治団体間のお金の流れも二重計上にならないように反映することで、可能な限り実態に即した形としているという。

企業団体献金が与野党で焦点になっており、国民の関心が高いことから、団体名や企業名でも検索できるようにした。

日本医師連盟で検索したところ
日本医師連盟で検索したところ。
Business Insider Japan
「うなぎ」で検索したところ。
「うなぎ」で検索したところ。
Business Insider Japan

コンサル経験者とエンジニアの同期コンビで活動

膨大な作業量のように思えるが、驚くべきことに基本的に西田さんを含め2人(業務委託を含めても最大3人)で作業しているという。それを可能にしているのが、西田さんがコンサル時代に培った業務スキルと、高度な技術力を持つ相棒エンジニアの存在だ。

西田さんは東京大学法学部を卒業後、「社会課題を解決したい」と考え、コンサル業界に飛び込んだ。アビームM&Aコンサルティング(当時、後にPwCが買収)に経営コンサルタントとして入社。企業のM&Aなどを担当し「短期間で未経験領域の知識を高速でキャッチアップし、アウトプットするというのを繰り返した4年間だった」(西田さん)と当時を振り返る。

コンサル会社勤務時代を振り返る西田さん。
コンサル会社勤務時代を振り返る西田さん。
撮影:樋口隆充

そこで大きく学んだスキルの一つが、データ収集の方法とその可視化というものだった。コンサル特有の物事の構造化というスキルも「データベースを構築する上で作業プロセスの効率化という点で生きている」と話す。

データベース構築の相棒は、西田さんが新卒入社した企業の同期。西田さんとは異なりコンサルタントではなく、エンジニアとしての入社だった。

この2人のタッグによって、作業プロセスの効率化はもちろん、懸念事項だった活動資金の圧縮にも成功した。

西田さんは運用コストについて「詳細な金額は言えないが、大人の趣味の範囲内でできる規模に収まっている」と明かした。構築に要する時間も、これまでの蓄積があることもあり「そこまで時間はかからない」という。

なお、同データベースからの収益は現状一切なく、低コスト運用とはいえ、活動自体は手弁当とのことだ。