ELYZA,国内最大の日本語特化AIエンジン「ELYZA Brain」記者発表会を開催
2020-9-23
オンラインで会見する
曽根岡侑也 氏(左)と松尾 豊 氏(右)
(株)ELYZA(イライザ)は,国内最大の日本語特化人工知能(AI)エンジン「ELYZA Brain」を開発,2020年9月17日(木)に記者発表会をオンラインで開催した。ELYZAは,日本のAI研究の第一人者である松尾 豊氏(東京大学大学院工学系研究科人工物工学研究センター教授)の研究室出身者らが2018年に創立したAIスタートアップ。自然言語処理に焦点を当てた研究開発に取り組み,技術力を強みとして,大企業向けにAI開発のコンサルティング事業を展開している。今回開発したELYZA Brainは,汎用言語モデルを活用したもので,大量の日本語テキストデータの学習量を持ち,自然言語処理技術(NLP)領域における国内最大の日本語AIエンジンである。記者発表会では,同社代表取締役CEOの曽根岡侑也氏がELYZA Brainの概略や開発の経緯,企業との事業共創プログラム「パートナープログラムNLP30」について紹介したほか,松尾氏が自然言語処理AIの最新動向や今後の展望について解説した。
記者発表会では,まず松尾氏が,「自然言語処理の進化と社会の変化」と題して講演を行った。言語処理モデルは,ディープラーニングの活用により急激な進化を遂げている。特に,2018年にGoogleが事前学習言語モデル「BERT」開発して以降,2019年には人間のテキスト認識精度を上回るレベルとなり,英語圏ではOpenAIが開発した「GPT-3」などが高い評価を得ている。松尾氏は,これらの自然言語処理AIの進化に伴い,今後はテキストを扱う業務をAIが代わりに行うようになると指摘。また,新型コロナウイルスが外圧となり,現在,日本社会にデジタル化を浸透させるチャンスにあると述べた。
続いて曽根岡氏が,ELYZA Brainの開発の背景や概略について紹介した。曽根岡氏は,GoogleのBERT登場以降,(1)優秀なモジュールの登場,(2)モデルの大規模化,(3)事前学習の実施という3要素の掛け合わせ効果により,大幅な精度向上が実現したと説明。これらの海外の流れを背景に,曽根岡氏らは,独自にきれいな日本語データを収集,国内最大規模のモデルで事前学習を行ったELYZA Brainの開発に成功したと経緯をまとめた。
ELYZA Brainはすでに大規模データで事前学習を行っているため,数千〜数万のデータで学習するだけで,「読む」「書く」「話す」のうち,文章の評価や分類,情報抽出などの「読む」業務の大半に適用可能である。例えば,契約書を大量に学習させることで,当事者や契約期間といった基本情報などを自動で抽出するツールの開発などが期待できる。曽根岡氏は,ELYZA Brainはすでにテキスト分類では人間より高い精度を実現しており,実際に人間の作業を代替する新たなユースケースの実現が可能になると述べ,同社が策定した,自然言語処理技術(NLP)のブレークスルーにより将来実現可能なユースケース「NLP30」を紹介した。NLP30には,医師に代わり書類作業を行う「AI医師」や契約書から危険条項抽出などを行う「AI弁護士」などの「業界特化型」,採用コミュニケーションを自動化する「AI人事」や潜在顧客を発掘し,ボットが自動でやりとりする「AI営業」などの「業界横断型」,B2Cなどのユースケースが含まれる。さらに曽根岡氏は,NLP30の実現には,業界に特化した知識や資産を持つパートナー企業が必要であるとし,パートナー企業を募集する「パートナープログラムNLP30」を開始,同日より募集を開始したことを発表した。採択企業には,検証フェーズにある開発リソースが無償提供され,ともにユースケース実現に取り組んでいく。なお,同プログラムは,自然言語処理分野での新たなユースケースの発掘や社会実装を目的とし,採択企業の課題最適化が重要であることから,ケースに応じて,ELYZA Brain以外のアルゴリズムの提供も行っていく。
●問い合わせ先
(株)ELYZA
https://elyza.ai