迷走ブログ

迷走している全ての人に役立つ情報を送るブログです

【ここまで来た!】くずし字の解読を変えるAI技術の進展

はじめに

最近ある企業のプレスが目に止まりました。

僕自身、元々のバックグランドが人文系ということもあり、興味深く記事を読んでいました。

prtimes.jp

 

まあ、面白い(もちろん、良い意味で)。

過去の災害記録から現代の防災への対応策を考える的な発想があるようです。そのためには、まずは効率よくかつ正確にくずし字を読み取れるようにしよう、ということらしいです。

 

AIでくずし字を読み解けるようにしよう、という発想自体はどうでも良いというか、一旦置いておきます。

 

そこよりも、トッパンさんがくずし字を読める人が少ない現代日本において、AIが読み取れるようにしようと、お金を出しているところが面白いです。

 

元々、印刷技術、読み取り技術(OCR)に関わるから(もっというと、日本の古典などの文化遺産を守るための高尚な技術?)ということなんでしょうが、それにしてもよく、投資しているなと(うちの会社ならばまずあり得ないことなので笑)。

 

何にしても、私自身も今はIT企業にいることもあいまって、今回は、くずし字とその解読に用いられる技術について調べてみようと思いました。

 

この記事の想定読者

  • 文化的遺産のデジタル化に興味がある人
  • 最新AI技術の応用に興味がある人
  • 過去/現在/未来、人文系を専攻した/している/する人

 

 

くずし字とは何か

くずし字といえば、厳密に言えば、現代も使っていますよね。

例えば、会議の場で、早口の人の言葉をメモするときとかです。

漢字を繋げて書く、文字の一部を省略して書くとかです。

 

あとは芸術の世界。そう、書道です。

 

一方で、古典文学とか、学校で習った古典の原文とかに使われているくずし字は、ちょっと今のくずし字と違う気がするわけです(僕だけ?)。

 

調べると、元々は、音と文字が一対一対応ではなかったため、くずし字としての種類(音に対応する文字のパターン)が多数存在するんだそうです。

 

例えば、「あ」という音に対する文字が「阿」「愛」など多数対応していたらしいです。

(だからこそ、対応するパターンを暗記しないと、くずし字が読みにくい!)

 

他にも下記の特徴がありそうです(私の推測)。

  • 簡略化: 漢字の筆画を省略し、少ない筆運びで表現されている。
  • 連続性: 筆画が連続して書かれ、一筆書きのような流れとなっている。
  • 変形: 一部の筆画が他の部分と融合し、原型から大きく変形する場合がある。
  • 個性: 書き手の個性が強く反映され、同じ文字でも書き手によって形が異なる場合がある。

 

 

AIによるくずし字の解読

現時点で、AIによるくずし字を解読するための開発をしている主な先行事例を探してみました。

 

「つくし」プロジェクト

まずネット検索すると、「つくしサーチ」がヒットしました。

 

codh.rois.ac.jp

 

「つくし」プロジェクトは、有名な人文系*AIのプロジェクトぽいです(すみません、知りませんでした)。

 

最近だと、なんとあのSakana AIの技術を取り入れているらしいです。

 

Sakana AIが開発した画像生成モデルEvo-Nishikieを活用した、日本古典籍の挿絵カラー化を公開しました。(

「つくし」プロジェクト | ROIS-DS人文学オープンデータ共同利用センター(CODH)

ニュースリリースより引用)

 

そういえば、Twitter(X)のタイムラインで、下記のプレスを見た気がする。

 

sakana.ai

 

とにかく、「つくし」プロジェクトは結構有名(というか大規模)ぽいです。

 

国文研DDHプロジェクト

もう一つヒットしたのは、国文研DDHプロジェクトです。

lab.nijl.ac.jp

 

こちらのプロジェクトの中で、テーマ4「人文系データ分析技術の開発」があります。

その概要を見てみると、なんと・・・トッパンさんがいるではないですか!?

 

国立情報学研究所、情報・システム研究機構データサイエンス共同利用基盤施設、一般財団法人人文情報学研究所、凸版印刷株式会社との間で現在個別に行っている共同的研究の成果に基づき、AI技術の活用による研究資料の抽出とその多分野への適応、テキスト分析・解析技術及び画像等の非テキストによる検索技術の開発、データ蓄積の国際標準化への対応を行ない、人文学系データをデータ駆動型に統合する方法と分析手法の開発を行います。(

Theme4 人文系データ分析技術の開発 - HumanitiesThroughDDPS

より引用)

 

テーマ4の中で、例えば、4.2に「画像検索・解析技術の精度向上と可視的把握技術の確立」というものがあります。

 

この概要には、以下の内容が書かれています。

 

国立情報学研究所、情報・システム研究機構データサイエンス共同利用基盤施設、凸版印刷株式会社との間で現在個別に行っている共同的研究の成果に基づき、AIの活用により、大規模データから機図や画像などの非テキスト情報による検索によって情報を抽出する技術の開発、テキストマイニングされた分析結果を可視的に把握する技術の先進的開発研究を行う。(

Theme4 人文系データ分析技術の開発 - HumanitiesThroughDDPS

)

きっと冒頭の熊本大との研究内容の技術には、ここら辺のテーマが絡んでくるのでしょうが、トッパンさんの出願している特許関連から技術要素を見てみるのが面白そうだなと感じました。

 

ただ、今回はそこまで深掘りするつもりはありません(というか、割愛)。

 

おまけ配信されているくずし字読み取りアプリ(2024年7月現在)

現在iTunesで配信されているくずし字読み取り関連のアプリだと以下のものがあるようです。

「miwo」は「つくし」プロジェクトのものです。

古文書カメラは、トッパンさんのもの。

早稲田大学からは「変体仮名あぷり」というものをリリースしているぽいです。

 

miwo

miwo

  • Tarin Clanuwat
  • 教育
  • 無料
古文書カメラ

古文書カメラ

  • TOPPAN PRINTING CO.,LTD.
  • 教育
  • 無料
変体仮名あぷり

変体仮名あぷり

  • WASEDA University
  • 教育
  • 無料

 

技術的な課題

くずし字の特徴からパッと思いつく限りの課題としては、以下のような感じですかね。

  • 前後の文字が続くため、文字の切れ目がわからない。
  • 「音」と「文字」が1対多のため、複数の字形が存在し、その音に適切な文字を特定するのが難しい。

下記の解説によると、どうやらくずし字特有の課題は他にもあるそうです。

codh.rois.ac.jp

 

くずし字読解AIが開く新たな可能性

くずし字を読める人が少ない以上、AIが読み取れるようになれば、歴史を学ぶのが容易になる(読み方のレクチャーを受けるとかの手間を省ける)という意味では良さそうですね。

 

また冒頭のプレスにも記載されている通り、過去を読み解き、未来に生かす的な(歴史を学ぶ)発想で、誰もが過去の文献にアクセスでき、そこから簡単に情報を得ることができる、ということでしょう。歴史を学ぶハードルが下がるのは良いことかなと。

 

もう一つは、生成AIでコンテンツ作成に活用されていくのだろうなと思います。

すでにSakana AIさんが取り組んでいる感じのものです。

テキスト/写真から、浮世絵に変換したいなど。

 

懸念なのは、生成されたコンテンツが歴史を捏造してしまわないか、ということだと思います。そこら辺は、現状、すかしを入れる、メタ情報に生成AIコンテンツであることを残すなどの対応をするしかないんでしょうね。

おわりに

くずし字の解読を変えるAI技術の進展の割には、AIについて全然触れられなかった。。。