生成AI

生成AIの主な種類を一挙解説! 代表的なサービスも紹介

  • 投稿日
    2025.03.27
  • 更新日
    2025.03.27

生成AIは各分野での活用が広がっており、近年は生成AIを導入する企業が増えています。
どのAIが自社に合っているのか、具体的にどのような種類があるのか詳しく知らないという方もいるのではないでしょうか。

生成AIには膨大なモデルが存在し、機能や強みがそれぞれ異なるため、自社の業種やニーズに合ったものを選ぶことが重要です。

本記事では、生成AIの概要や主な種類について解説します。

生成AIとは?

生成AI(ジェネレーティブAI)は、人工知能の一種であり、指示(プロンプト)に応じて画像や動画などのコンテンツを生成できるのが特徴です。
ディープラーニング(深層学習)を活用して構築された、比較的新しいAIモデルです。

生成AIには明確な定義はありませんが「プロンプトに従ってテキストや画像などを出力できるもの」と理解すると良いでしょう。

従来のAIとの違い

従来のAIといえば、識別系AI(Discriminative AI)を指すことが一般的です。
識別系AIは与えられたデータからパターンを認識し、データの正誤判定を行うために活用されていました。

一方、生成AIでは学習したパターンに基づいて、画像やテキストなどの新しいコンテンツを生み出せるのが特徴です。

生成AIは、機械学習を活用した技術の一種であり、その点では従来のAIと共通していますが、今までは人間が行っていたクリエイティブな作業を代行できる点で、大きな進歩を遂げたといえるでしょう。

生成AIに注目が集まる理由

生成AIが注目を集めているのは、生成AI自体の精度向上や、誰でも簡単に使用できる使い勝手の良さが大きな理由です。

実際に生成AIを使用する際、プログラミングのような専門知識は必要ありません。
簡単な指示を入力するだけで、高品質な成果物を得られるため、身近なサービスにも導入が進んでいます。

事実とは異なる情報を生成してしまうハルシネーションのような問題も存在するものの、業務の効率化や生産性の向上などのメリットが生成AIの普及を押し上げています。

生成AIの主な種類一覧

生成AIの開発は年々進んでおり、現在ではさまざまな種類の生成AIが誕生しています。
そのため、用途に応じて生成AIを使い分ければ、期待に近い生成物を出力することが可能です。

ここでは、以下8種類の生成AIに関して、概要と代表的なモデルを紹介します。

  • 会話型
  • 要約型
  • 記事作成型
  • コード生成型
  • 画像生成型
  • 動画生成型
  • 音楽生成型
  • その他の生成AI

会話型

会話型の生成AIは、まるで人間と話しているように自然な会話を実現するのが特徴です。
自然言語処理を用いた機械学習を行うことで、人間が入力したテキストを基に自然な回答を作成します。

会話型の生成AIは幅広い分野で導入されており、できることは会話だけではありません。
例えば、テーマに沿ったブログ記事の作成や、SNSの投稿文の考案なども可能です。

またビジネスシーンでは、顧客からの問い合わせに対応するAIチャットボットとして導入されています。

代表的な生成AIには以下の3種類があります。

  • ChatGPT
  • Microsoft Copilot
  • Google Gemini

ChatGPT

ChatGPTは、アメリカのOpenAIが開発した対話型のテキスト生成モデルです。
高い性能と使い勝手の良さから、世界中で注目されています。

複数の機能を有しており、自然なテキストを生成するだけでなく翻訳や要約、プログラミングコードの生成なども可能です。

また、2024年5月には「ChatGPT‐4o」が発表され、ボイスモードにも対応したことで、自然なテンポでの音声会話も可能となりました。

Microsoft Copilot

Microsoft CopilotはMicrosoftによって開発された生成AIで、自然言語とMicrosoft AIモデルを組み合わせたチャット機能を持つ点が特徴です。

テキストや音声でMicrosoft Copilotに指示を伝えるだけで、タスクの実行や情報の検索、コンテンツ生成などを行えます。

またMicrosoft Copilotは、Microsoft365をはじめとしたMicrosoft Officeの各製品と連携して使えるのも魅力です。

Google Gemini

Google Geminiは、アメリカのGoogleが開発したマルチモーダル生成AIモデルです。
テキストや画像、動画など複数の異なるデータを同時に学習・処理できます。

「Gemini 2.0 Flash」や「Gemini 2.0 Pro Experimental」をはじめとする多様なモデルがあり、データセンターからモバイル端末まで柔軟に利用できるのも特徴です。

要約型

要約型の生成AIは、与えられたテキストから重要なポイントを抜き出して短くまとめられるのが特徴です。
重要なポイントだけを抜き出すことで、短い時間でより多くの情報を理解する際に役立ちます。

例えば、ニュース記事や論文から要点を抜き出せるため、ビジネスシーンおけるプレゼン資料の作成を効率化できるでしょう。

また、多言語に対応したモデルを活用することで、日本語だけでは得られない情報の迅速な入手も可能です。

代表的な生成AIには以下の3種類があります。

  • DeepL Write
  • ELYZA LLM
  • QuillBot

DeepL Write

DeepL Writeは、ドイツのスタートアップ企業であるDeepLが開発した生成AIです。

テキストを入力するだけで、対応言語で書かれた文の文法ミスを修正することができ、言い回しの提案にも対応しています。
ユーザー自身が言い回しを考える必要がないため、テキスト作成の効率化が可能です。

語句や言い回しを細かく提案してくれる機能もあるため、メールやプレゼン資料の作成の際に役立つでしょう。

ELYZA LLM

ELYZA LLMは、東京大学発のスタートアップ企業が開発した生成AIモデルです。
開発初期にはELYZA DIGESTというAI要約ツールを提供していましたが、現在は対話型のテキスト生成やAPI連携などを提供しています。

日本語での対話・タスクの実行に関しては、海外製LLMに匹敵するほどの性能を実現しました。

従来のLLMとは異なり日本語がベースとなっているため、日本人にとって自然な会話が可能です。

QuillBot

QuillBotは、生成AIを活用したパラフレーズツールです。
入力した英文の要約やスペルミスのチェックなど、さまざまな機能を搭載しています。

特に英語でのテキスト作成に強く、英語で論文を作成する際に役立つツールです。
テキストのスタイルやトーンを指定するだけで、自然な形に書き換えてくれます。

またQuillBotはChromeやMicrosft Wordと直接統合でき、既存のテキスト作成ツールと連携も可能です。

記事作成型

記事作成型の生成AIは、指定されたテーマやキーワードに沿って記事を作成できるのが特徴です。
人が記事を作成するよりも効率が良く、SEOライティングを的確にサポートしてくれます。

例えば、ブログ記事やSNSの投稿文だけでなく、商品説明ページや広告のキャッチコピーまで作成が可能です。

記事作成を完全に任せられるわけではありませんが、アイデア出しや原稿の下書きに活用できます。
そのため、従来よりも作業効率を向上させられるでしょう。

代表的な生成AIには以下の2種類があります。

  • Claude
  • Transcope

Claude

Claudeは、アメリカのスタートアップ企業であるAnthropicによって開発されたAIチャットモデルです。
ChatGPTやGeminiと同様にテキスト生成や要約、翻訳などの作業に対応しています。

現在は無料版と有償版の2種類が提供されており、個人向けのProプランは月額20ドルで利用可能です。

また、2024年6月に登場した「Claude 3.5 Sonnet」は、大規模なタスクを迅速に処理する高い性能を持っています。

Transcope

Transcopeは、SEOライティングや社内文書作成を得意とする生成AI記事作成ツールです。
テーマやキーワードを入力するだけで、SEOを考慮した記事を自動で作成できます。

OpenAI社が開発したGPT-4の最新APIを活用しており、検索順位の向上を目指せるのが特徴です。

またインターネット上の情報を追加で学習させれば、マーケティングの企画書作成や生成AIコンサルタントとしての活用もできます。

コード生成型

コード生成型の生成AIは、プロンプトを基にプログラミングコードの作成を支援するのが特徴です。

例えば「HTMLとJavaScriptを使って、ユーザーが問い合わせをするためのフォームを作成して」とプロンプトを入力するだけで、指示通りに実行してくれます。

コード生成型の生成AIを活用することで、エンジニアの業務量を削減し、業務の効率化が可能です。
ただし、あくまでも大枠を作成するものであり、想定通りの挙動を示すかの確認は必要になる点には留意しましょう。

代表的な生成AIには以下の2種類があります。

  • GitHub Copilot
  • Amazon CodeWhisperer

GitHub Copilot

GitHub Copilotは、エンジニアのコーディング業務を支援するための生成AIです。
エンジニアが入力したコメントや関数に対して、AIが適したコードを提案してくれます。

コードの自動補完やクラスの生成などにも対応しており、コーディング業務の効率化が可能です。

またGitHub Copilotは、PythonやJava Scriptなどの主要なプログラミング言語に対応しているため、幅広いタスクで活用できます。

Amazon CodeWhisperer

Amazon CodeWhispererは、Amazon社が開発したコーディングサポートAIです。
2023年4月に一般公開され、VS CodeやIntelliJ IDEA、AWS Cloud9などの開発環境で利用できます。

世界中のオープンソースやAPIなどの膨大なデータを学習しており、自動で適切なコードを生成・提案してくれるのが特徴です。

法人版は有料ですが、個人の開発の場合は無料のため、AWS Builder IDを登録すれば利用できるようになります。

画像生成型

画像生成型の生成AIは、プロンプトに基づいて画像やイラストを生成できるのが特徴です。

例えば、ブログ記事やSNSに投稿するための画像を生成AIで作成することで、投稿するまでの準備を簡略化できるでしょう。

また画像やイラストの生成は、Webサイトのバナーやロゴ、アイコン作成にも役立ちます。
ただし、生成された画像やイラストが他者の著作権を侵害する可能性があるため、商用利用には注意が必要です。

代表的な生成AIには以下の2種類があります。

  • Stable Diffusion XL
  • Adobe Firefly

Stable Diffusion XL

Stable Diffusion XLは、Stability AI社が開発した画像生成モデルです。
無料で公開されており、入力されたテキストに応じた画像を生成してくれます。

例えば、「空を泳ぐ魚」と入力すると、プロンプトに応じた画像が生成されます。
画像のスタイルに関しては、イラストや写真、アニメなど好みのスタイルを選択可能です。

従来のモデルよりも改良されているため、世界中の利用者から高評価を得ています。

Adobe Firefly

Adobe Fireflyは、Adobeが開発した生成AIでPhotoshopに搭載されています。
ブラウザ上で利用でき、画像の内容を損なわずに追加・拡張・置き換え・削除などが可能です。

ベータ版では「生成塗りつぶし」「生成拡張」の商用利用が禁止されていましたが、正式版がリリースされたことで商用利用が可能となりました。

また生成AIの学習に使用した画像の透明性が担保されているため、他者の著作権を侵害する心配もありません。

動画生成型

動画生成型の生成AIは、プロンプトとして入力されたテキストや画像データから、新しい動画を生成できるのが特徴です。
これまで動画作成には高い技術が必要とされていましたが、生成AIの登場によって難易度が下がりました。

現時点では、数秒程度の短い動画の生成がメインです。
ただし、将来的には高品質で長尺の動画を生成できる可能性があるでしょう。

国内でも実際に、動画生成AIを活用してCMが作成された例があります。

代表的な生成AIには以下の2種類があります。

  • Runway Gen-2
  • Make-A-Video

Runway Gen-2

Runway Gen-2は、Runway社が開発した動画生成AIサービスです。
入力された画像データを基に、動画を自動で生成できます。
また、任意の画像やプロンプトで指定したスタイルを動画の各フレームに適用可能です。

多機能性と使い勝手の良さから、Runway Gen-2は注目を集めています。
複雑なプログラミング知識は必要なく、直感的なインターフェースによって誰でも簡単に動画の生成が可能です。

Make-A-Video

Make-A-Videoは、FacebookやInstagramで有名なMeta社が開発した動画生成AIです。
特に、既存の動画から自然な動きを学習し、高品質な映像を生成できるのが特徴です。
また、ユーザーはテキストから生成した動画を簡単に編集・拡張できるため、クリエイティブな表現がさらに広がります。

音楽生成型

音楽生成型の生成AIは、プロンプトを基に音楽を生成できるのが特徴です。
生成AIを活用することで、音楽に関する知識がない方でも簡単に楽曲を作成できます。

音楽生成型の代表的なモデルを紹介するので、チェックしておきましょう。

Soundraw

Soundrawは、SOUNDRAW株式会社が提供する著作権フリーのAI作曲サービスです。

「ムード」「ジャンル」「テーマ」の3つを指定するだけで、誰でも簡単にオリジナル曲を生成できます。
無数のサウンドフレーズを組み合わせることで、自由度の高い作曲が可能です。

また生成された楽曲は著作権フリーのため、PR動画や広告動画、動画配信のBGMとして利用できます。

生成AIの種類を把握して、ニーズに合ったモデルを選ぼう

生成AIには会話型や画像生成型、動画生成型などさまざまな種類が存在します。
どの生成AIを選ぶかによってできることが変わるため、自社のニーズに合ったサービスを選ばなければなりません。
例えば、テキスト作成に活用する場合は、ChatGPTやClaudeがおすすめです。

TDSE株式会社では、生成AIの導入サポートを提供しています。
業種や業務別に適した生成AIの導入が可能なため、自社への導入を検討している担当者の方はお気軽にご相談ください。

Difyはこちら
LLM活用支援サービスはこちら

お問い合わせはこちら

お問い合わせ

資料ダウンロードはこちら

サービス資料ダウンロードはこちら