本書の詳細
いま最も注目される最先端のフレームワークの実力を試してみよう!
人間が書いたような自然な文章に加え、自然言語からプログラムのソースコードやWebページのレイアウトまでも生成したことで大きな話題になった「GPT-3」、そしてそれを画像処理に応用した「DALL-E」といった最先端の深層学習フレームワークがここ数年で登場してきました。
本書では、注目を集めている「自然言語処理」「画像処理」「音声処理」の主要なフレームワークを取り上げ、実際にそれらの実力を試してみることができるように、インストールから各種設定、データセットの準備、学習・推論まで、ステップ・バイ・ステップでていねいに解説しました。
さまざまな分野や今後の実務にも応用範囲が広がると期待されている最先端のAIを学ぶことができる1冊です。
本書で紹介するフレームワーク
・自然言語処理:GiNZA、Huggingface Transformers、BERT、GPT-2、T5、GTP-3
・画像処理:Vision Transformer、DeiT、CLIP、Image GPT、DALL-E、BigSleep、DeepDaze
・音声処理:Tacotron2+WaveGlow、NEUTRINO、Jukebox
ダウンロードデータは、ZIP形式で圧縮されています。WinZip(Windows)やStuffit(Macintosh)等のアプリケーションで解凍してご使用ください(ファイルサイズ:約170KB)。
目次
1章 自然言語処理と深層学習
1-1 自然言語処理の概要
1-2 深層学習の概要
1-3 自然言語処理の深層学習モデル
2章 Python開発環境の準備
2-1 Pythonと開発環境の概要
2-2 Google Colabの概要
2-3 ローカルマシンのPython環境の準備
2-4 Pythonの文法
3章 GiNZA
3-1 GiNZAの概要
3-2 形態素解析
3-3 係り受け解析
3-4 固有表現抽出
3-5 ルールベースマッチング
3-6 正規表現
4章 Huggingface Transformers
4-1 Huggingface Transformersの概要
4-2 トークナイザー
4-3 テキスト分類
4-4 質問応答
4-5 要約
4-6 テキスト生成
4-7 言語モデル
5章 GPT-3・Vision Transformer・CLIP・Image GPT・DALL-E
5-1 GPT-3によるプロンプトプログラミング
5-2 Vision Transformerによる画像分類
5-3 CLIPによる未学習カテゴリでの画像分類
5-4 Image GPTによる半分画像からの画像生成
5-5 DALL-Eによるテキストからの画像生成
6章 Tacotron2+WaveGlow・NEUTRINO・Jukebox
6-1 Tacotron2+WaveGlowによる音声合成
6-2 NEUTRINOによる歌声合成
6-3 Jukeboxによる歌声付きの楽曲生成
7章 Google Cloud Platform
7-1 Google Cloud Platformの概要
7-2 Natural Language API
7-3 Text-to-Speech API
7-4 Speech-to-Text API
7-5 Translation API