トップ » BOOK » BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理人工知能プログラミング実践入門

BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理人工知能プログラミング実践入門

著者：布留川英一

定価	3,960円（本体3,600円＋税10%）
発行・発売	株式会社ボーンデジタル
ISBN	978-4-86246-509-2
総ページ数	312ページ
サイズ	B5変形、オールカラー
発売日	2021年9月上旬

本書の詳細

「はじめに」「本書の構成」「目次」をPDFで公開中！

いま最も注目される最先端のフレームワークの実力を試してみよう！

人間が書いたような自然な文章に加え、自然言語からプログラムのソースコードやWebページのレイアウトまでも生成したことで大きな話題になった「GPT-3」、そしてそれを画像処理に応用した「DALL-E」といった最先端の深層学習フレームワークがここ数年で登場してきました。

本書では、注目を集めている「自然言語処理」「画像処理」「音声処理」の主要なフレームワークを取り上げ、実際にそれらの実力を試してみることができるように、インストールから各種設定、データセットの準備、学習・推論まで、ステップ・バイ・ステップでていねいに解説しました。

さまざまな分野や今後の実務にも応用範囲が広がると期待されている最先端のAIを学ぶことができる1冊です。

本書で紹介するフレームワーク
・自然言語処理：GiNZA、Huggingface Transformers、BERT、GPT-2、T5、GTP-3
・画像処理：Vision Transformer、DeiT、CLIP、Image GPT、DALL-E、BigSleep、DeepDaze
・音声処理：Tacotron2+WaveGlow、NEUTRINO、Jukebox

ダウンロードデータは、ZIP形式で圧縮されています。WinZip（Windows）やStuffit（Macintosh）等のアプリケーションで解凍してご使用ください（ファイルサイズ：約170KB）。

ダウンロード

5章　GPT-3・Vision Transformer・CLIP・Image GPT・DALL-E
5-1 GPT-3によるプロンプトプログラミング
5-2 Vision Transformerによる画像分類
5-3 CLIPによる未学習カテゴリでの画像分類
5-4 Image GPTによる半分画像からの画像生成
5-5 DALL-Eによるテキストからの画像生成

6章　Tacotron2+WaveGlow・NEUTRINO・Jukebox
6-1 Tacotron2＋WaveGlowによる音声合成
6-2 NEUTRINOによる歌声合成
6-3 Jukeboxによる歌声付きの楽曲生成

7章　Google Cloud Platform
7-1 Google Cloud Platformの概要
7-2 Natural Language API
7-3 Text-to-Speech API
7-4 Speech-to-Text API
7-5 Translation API

いつもクリエイターのそばに

CONTACT

ONLINE STORE

CGiN

ボーンデジタルオンラインブックストア

CGWORLD SHOP

TOOLFARM Japan

Font Garage