生成AIはなんてちゃってAIか?エンジニア視点の生成AI【2025年3月】

生成AIはなんてちゃってAIか?エンジニア視点の生成AI【2025年3月】

生成AIはなんてちゃってAIか?エンジニア視点の生成AI メニュー

嘘つき生成AI

chatGPTに代表される生成AI、めっちゃ流行っちゃってるねぇ。

2023年にchatGPTを触ったときは「こりゃオモチャで、なんちゃってAIじゃん。大袈裟な名前つけるなよ。使えねぇ。」だった。

「AはBである!」と思いっきり自信ありげにをつく。これを「ハルシネーション」と呼ぶ。

chatGPTの2023~2025の進化

2年後(2025年2月)、chatGPTがスゴイと話題になっているので久しぶりに触ってみると、かなり実用的になっていた。2023年より推論モデルが大幅に進歩していて、2023年のような簡単な問いに「ハルシネーション」を起す事はなくなっている。

「ハルシネーション」がなくなったのか?というと違う。専門性の高い分野では、普通に自信ありげに嘘をつく。

データセットをカスタマイズすれば実業務に利用可能なレベルまで行けるかもしれない。

2023年段階では「本格的に調査」「生成AIの学習理論」「具体的な生成AIの学習方法」「生成AIの設計・実装」「APIの利用」などを学ぶ必要はないと考えたが、2023年に見送った調査・学習を始めることにした。

ハッピーなchatGPT

実業務で求められる生成AIのレベル

実業務、例えば市役所の受付業務で「ハルシネーション」が発生しては使い物にならない。100%の精度で正しい回答ができる必要がある。

専門性のまったくない通常の会話レベルを「基本データセット」と定義した場合、基本データセット段階で「ハルシネーション」が発生してしまうようでは使い物にならない。

この段階では「ハルシネーション」は発生せず、知らないものは知らないと答える必要がある。

基本データセット段階で問題ない場合、市役所業務の専門的なデータセットを学習させる。100%の精度で正しい回答を出来れば実業務でも利用可能になる。

LLM(大規模言語モデル)

LLM(Large language Models)と、従来のレキシコンベースの言語処理モデルとの違いは「パラメータ数(ディープラーニング技術に特有の係数の集合体)」だ。

元々、レキシコンやレキシコンベースの言語処理モデルでも「データ量(登録する情報量)」「計算量(コンピューターが処理する仕事量)」は膨大であり、実行形式のデータやファイルを生成するプロセスは、労働集約的かつ膨大な作業量だ。

おすすめ記事

レキシコン レキシコン

レキシコンは語彙の集合(辞書的な知識)で「コンピューターにおけるレキシコン」と「言語学におけるレキシコン」「哲学・認知科学におけるレキシコン」では意味が変わってくる。

生成AIは膨大なレキシコンを学習させているので、レキシコンの持つ単語同士の意味や関連性を理解している・・・  続きを見る 

Copyright (C) 2017~2025年 nurikaeya.jp All Rights Reserved. Update 2025年3月29日
運営者情報 ご質問はこちらへお願いします info@c-show.jp