平成30年度(2018) 成果報告2
「くずし字OCR」を活用した総合的古典籍データベースの構築
本事業は、「くずし字OCR」技術を利用して演劇関係の古典籍(特に浄瑠璃丸本と歌舞伎番付)をめぐる新たな研究環境の構築を目指すものである。
2018年度の大きな成果は、昨年度まで蓄積してきた研究成果に更なるデータを付加することにより、浄瑠璃丸本と歌舞伎番付それぞれの資料に即したデータベースの多機能化を図り、総合的な古典籍データベースのひとつのモデルを提示したことにある。
文字譜入力画面
Mojifu input screen
浄瑠璃丸本(「仮名手本忠臣蔵」と「義経千本桜」)については、これまで作成してきた翻刻データにくわえ、ルビ、捨て字、そして浄瑠璃の節回しを示す文字譜の情報を追加して表示するビューアの更新を図った。文字譜は浄瑠璃丸本の復刻出版に際して常に問題になってきた要素であるが、今回は初めてデータベースやウェブブラウザ上での表示を試みるため、田草川みずき氏(千葉大学准教授)に協力いただいて文字譜のデータ蓄積の方針、ウェブブラウザで表示するビューアの表示方法を検討した。データ公開に際しては、早稲田大学の「文化資源データベース」上で文字譜専用のデータベースを作って、これと本拠点のウェブサイト上のビューアと連携させるなど、将来的な丸本研究にも益するかたちで検索を可能にするモデルを模索した。
翻刻表示画面(左:全文・ルビ・捨て仮名、右:文字譜)
Digital transcription display screen
(Left: full text/ruby characters/sutegana, right: mojifu)
歌舞伎番付については新たに顔見世番付2件、役割番付2件のデータを作成するとともに、これまでは対象としていなかった家紋などのデータ化を進めた。この点は、画像をデータベース化することが可能となった、現代らしい番付の活用法といえよう。
これらのデータは、新たに更新したビューアにより当拠点のウェブサイト上でオンライン公開するなど、デジタル公開の長所を活かした総合的データベースの可能性を具体的に示すものと位置づけられる。
2019年3月には楽劇学会でのパネルディスカッション「くずし字とデジタル化:演劇博物館における『くずし字判読支援研究』」で田草川みずき氏、大澤留次郎氏(凸版印刷株式会社)、柴田が登壇し、本事業での研究成果を報告する予定である。また3年間の事業の経過をまとめた「くずし字の符号化をめぐるガイドライン」を作成し、今後、国内外の研究施設で同様の試みがなされる際の基礎的な指針を提示する予定である。