ELYZA，国内最大の日本語特化AIエンジン「ELYZA Brain」記者発表会を開催

2020-9-23

AI（人工知能）

オンラインで会見する
曽根岡侑也氏（左）と松尾　豊氏（右）

（株）ELYZA（イライザ）は，国内最大の日本語特化人工知能（AI）エンジン「ELYZA Brain」を開発，2020年9月17日（木）に記者発表会をオンラインで開催した。ELYZAは，日本のAI研究の第一人者である松尾　豊氏（東京大学大学院工学系研究科人工物工学研究センター教授）の研究室出身者らが2018年に創立したAIスタートアップ。自然言語処理に焦点を当てた研究開発に取り組み，技術力を強みとして，大企業向けにAI開発のコンサルティング事業を展開している。今回開発したELYZA Brainは，汎用言語モデルを活用したもので，大量の日本語テキストデータの学習量を持ち，自然言語処理技術（NLP）領域における国内最大の日本語AIエンジンである。記者発表会では，同社代表取締役CEOの曽根岡侑也氏がELYZA Brainの概略や開発の経緯，企業との事業共創プログラム「パートナープログラムNLP30」について紹介したほか，松尾氏が自然言語処理AIの最新動向や今後の展望について解説した。

記者発表会では，まず松尾氏が，「自然言語処理の進化と社会の変化」と題して講演を行った。言語処理モデルは，ディープラーニングの活用により急激な進化を遂げている。特に，2018年にGoogleが事前学習言語モデル「BERT」開発して以降，2019年には人間のテキスト認識精度を上回るレベルとなり，英語圏ではOpenAIが開発した「GPT-3」などが高い評価を得ている。松尾氏は，これらの自然言語処理AIの進化に伴い，今後はテキストを扱う業務をAIが代わりに行うようになると指摘。また，新型コロナウイルスが外圧となり，現在，日本社会にデジタル化を浸透させるチャンスにあると述べた。

松尾　豊氏（東京大学）

続いて曽根岡氏が，ELYZA Brainの開発の背景や概略について紹介した。曽根岡氏は，GoogleのBERT登場以降，（1）優秀なモジュールの登場，（2）モデルの大規模化，（3）事前学習の実施という3要素の掛け合わせ効果により，大幅な精度向上が実現したと説明。これらの海外の流れを背景に，曽根岡氏らは，独自にきれいな日本語データを収集，国内最大規模のモデルで事前学習を行ったELYZA Brainの開発に成功したと経緯をまとめた。

ELYZA Brainはすでに大規模データで事前学習を行っているため，数千〜数万のデータで学習するだけで，「読む」「書く」「話す」のうち，文章の評価や分類，情報抽出などの「読む」業務の大半に適用可能である。例えば，契約書を大量に学習させることで，当事者や契約期間といった基本情報などを自動で抽出するツールの開発などが期待できる。曽根岡氏は，ELYZA Brainはすでにテキスト分類では人間より高い精度を実現しており，実際に人間の作業を代替する新たなユースケースの実現が可能になると述べ，同社が策定した，自然言語処理技術（NLP）のブレークスルーにより将来実現可能なユースケース「NLP30」を紹介した。NLP30には，医師に代わり書類作業を行う「AI医師」や契約書から危険条項抽出などを行う「AI弁護士」などの「業界特化型」，採用コミュニケーションを自動化する「AI人事」や潜在顧客を発掘し，ボットが自動でやりとりする「AI営業」などの「業界横断型」，B2Cなどのユースケースが含まれる。さらに曽根岡氏は，NLP30の実現には，業界に特化した知識や資産を持つパートナー企業が必要であるとし，パートナー企業を募集する「パートナープログラムNLP30」を開始，同日より募集を開始したことを発表した。採択企業には，検証フェーズにある開発リソースが無償提供され，ともにユースケース実現に取り組んでいく。なお，同プログラムは，自然言語処理分野での新たなユースケースの発掘や社会実装を目的とし，採択企業の課題最適化が重要であることから，ケースに応じて，ELYZA Brain以外のアルゴリズムの提供も行っていく。

曽根岡侑也氏（ELYZA）

自然言語処理技術（NLP）のブレークスルーにより将来実現しうるユースケース「NLP30」

●問い合わせ先
（株）ELYZA
https://elyza.ai

AI（人工知能）

取材報告

AI（人工知能）