生成AI

生成AIの種類一覧!おすすめのサービスも解説

  • 投稿日
    2024.09.27
  • 更新日
    2024.09.27

生成AIは、顧客や社内従業員からの問い合わせ対応、資料作成など、さまざまな場面で活用可能です。

生成AIサービスは、大きく分けて画像生成AI、動画生成AI、音声生成AI、音楽生成AI、テキスト・コード生成AIの5種類があります。
生成AIをビジネスシーンで活用するためには、サービスごとに得意としている分野を把握することが大切です。

本記事では生成AIサービスの種類について解説します。

またおすすめのサービスも紹介するので、どの生成AIサービスを導入しようか悩んでいる方は、ぜひ参考にしてください。

生成AI の種類一覧と各サービスの紹介

生成AIの種類は、大きく次の5種類に分けられます。

  • 画像生成AI
  • 動画生成AI
  • 音声生成AI
  • 音楽生成AI
  • テキスト・コード生成AI

生成AIはサービスごとに得意としている分野が異なります。

そのため、自社の目的に応じた生成AIサービスを導入しましょう。

画像生成AI

画像生成AIを活用すると、画像やイラストを生成可能です。
例えば企業ロゴや商品画像の作成などに活用できます。

画像生成AIには、主に次のようなサービスがあります。

  • Stable Diffusion
  • Midjourney

【Stable Diffusion】商用利用が可能

Stable Diffusion(ステーブル・ディフュージョン)はイギリス発の画像生成AIです。

Stable Diffusionはソースコードが公表されているオープンソースのため、Webもしくはオフラインで利用できます。
オフラインでの利用はデバイスのスペックが限定されるものの、Web版であればインターネット環境が整っていれば誰でも利用可能です。

Stable Diffusionは、希望するイメージをテキストとして入力するだけで画像を生成できます。

さらに生成した画像は商用利用が可能です。

【Midjourney】プロンプトの非表示が可能

Midjourney(ミッドジャーニー)はアメリカで開発された画像生成AIです。

Midjourneyでは次のような4つの有料プランが用意されています。

  • Basic Plan
  • Standard Plan
  • Pro Plan
  • Mega Plan

このうちPro Plan、Mega Planはステルスモードが使用可能です。
ステルスモードであれば、自分が生成AIに出した指示(プロンプト)を非表示にできます。

なおMidjourneyも一定の条件を満たすことで、商用利用が認められます。

動画生成AI

動画生成AIを活用すると、テキストや画像から動画を自動で生成可能です。
また動画の編集も動画生成AIによって行えます。
生成した動画は、プロモーションなどに活用できます。

動画生成AIサービスとして主に以下が挙げられます。

  • Sora
  • Runway Gen-2

【Sora】OpenAI社が開発した動画生成AI

Soraは、ChatGPTで知られるOpenAI社が開発した動画生成AIです。
Soraはプロンプトとしてテキストを入力するだけで、最長1分間の動画を作成できます。

しかし、2024年9月時点で日本ではリリースされていません。

【Runway Gen-2】画像からでも動画生成が可能

Runway Gen-2は、アメリカ・ニューヨークを拠点とするRunway社が手掛ける動画生成AIです。
Runway Gen-2はテキストから動画を生成できるだけではなく、画像を動画にすることも可能です。

Runway Gen-2は無料で利用可能なプランに加えて、4つの有料プランが展開されており、プランごとに生成可能な動画の本数が異なります。
なおRunway Gen-2に次ぐモデルとして、2024年6月にはGen-3 Alphaがリリースされました。

音声生成AI

音声生成AIは、音声や音楽、動画などを学習して音声を作り出すAIです。
コールセンター対応や、音声で回答する音声ボットなどでの活用が期待されています。

主な音声生成AIサービスとして挙げられるのは以下の通りです。

  • Text-to-Speech AI
  • VALL-E

【Text-to-Speech AI】Googleが提供する音声生成AI

Text-to-Speech AIはGoogleが提供している音声生成AIで、テキストをスムーズな音声として生成可能です。

スタジオで録音されたかのような音質のため、動画のナレーションとしても活用できるでしょう。
Text-to-Speech AIは、生成した音声の文字数に応じて料金が変動します。

【VALL-E】Microsoftが手掛ける音声生成AI

VALL-EはMicrosoftが手掛けた音声生成AIで、独自の技術、ニューラルコーデック言語モデルが採用されています。

日本語に対応しているのはVALL – E Xで、英語や中国語への翻訳にも対応可能です。
また、EmoV-DBと呼ばれる感情データベースをサンプリングすると、情感がこもった音声を生成可能です。

音楽生成AI

音楽生成AIは大量の楽曲データを学習し、メロディやハーモニー、リズムなどを分析してオリジナルの音源を生成します。

音楽生成AIを活用すれば専門的な知識がなくとも、コストを抑えてオリジナル音源を制作可能です。

音楽生成AIとして以下が挙げられます。

  • Suno AI
  • MusicLM

【Suno AI】テキストによって音楽の生成が可能

Suno AIは、アメリカのマサチューセッツ州に拠点を構えるチームが手掛ける音楽生成AIです。

Suno AIは開発に音楽家やAIの専門家が関わっていて、テキストを入力するだけでさまざまな楽曲を生成可能です。
Suno AIには無料プランと有料プランがあります。

無料プランは商用利用が認められない上に、制作可能な音源数が有料プランよりも少なくなります。

【MusicLM】Googleによる音楽生成AI

MusicLMは、Googleが発表した音楽生成AIです。

MusicLMはプロンプトとして、ジャンルやテンポ、ムードを生成AIに伝えることで音楽を生成してくれます。
一度に2曲を生成可能で、完成した楽曲はダウンロードが可能です。

テキスト・コード生成AI

テキスト・コード生成AIでは、自動でテキストやプログラミングコードを生成可能です。

例えば社内や顧客からの問い合わせに対して、テキストで自動返信できます。

テキストやプログラミングコードを作り出せる生成AIとして、主に以下が挙げられます。

  • ChatGPT
  • Gemini
  • Claude

【ChatGPT】基本無料で利用可能

OpneAI社が手掛ける生成AIがChatGPTです。

2022年にGTP-3.5がリリースされ、多くのユーザーが利用しました。
その後、2023年にはより精度の高いGPT-4がリリースされたことで、より広く知られるようになりました。

ChatGPTは基本無料で利用できるものの、より高精度の機能を求めるのであれば、有料のChatGPT Plusを利用すると良いでしょう。

【Gemini】Googleが開発した生成AI

GeminiはGoogleが開発した生成AIです。

Googleが開発した生成AIは従来、Google Bardと呼ばれていましたが、2024年にGeminiへ名称が変更されました。
GeminiはGoogleが手掛けているためリサーチに長けており、専門性の高いテキスト作成が期待できます。

GeminiはGoogleアカウントがあれば無料で利用可能です。
より高い精度を求めるのであれば、有料のGemini Advancedを検討しましょう。

【Claude】複雑なタスクにも対応

ClaudeはアメリカのAnthropic社が開発した生成AIです。

Claudeは次の通り、基本無料または有料の3つのプランがあります。

  • Sonnet:基本無料
  • Opus:有料
  • Haiku:有料

有料プランのうち、Opusは複雑なタスクを、Haikuはスピーディな回答を得意としています。

生成AIサービスでコンテンツを生成する際の注意点

生成AIサービスを活用すれば画像や動画、音楽などさまざまなコンテンツをスピーディに生成可能です。

しかし、生成AIサービスでコンテンツを生成する際は、次のような点に注意しましょう。

  • 著作権を侵害している可能性がある
  • 誤った情報を提供する可能性がある

著作権を侵害している可能性がある

生成AIサービスでコンテンツを生成する際、著作権を侵害している可能性があります。

生成AIサービスは事前にした学習した情報をベースにコンテンツを生成します。
そのため、学習情報に著作物が含まれている場合、類似したコンテンツを生成しかねません。

著作権を遵守するためには学習データが偏らないようにする、他人の著作物を学習させないなどの対策を講じましょう。

誤った情報を提供する可能性がある

生成AIによって提供される情報は誤っている可能性があります。
このように生成AIの情報が誤ってしまう理由は、学習データの量や質などが原因です。

誤った情報を受け取らないためにも、ファクトチェックの体制を整えましょう。

生成AIは自社のニーズに合ったサービスを導入しよう

生成AIは、画像生成AI、動画生成AI、音声生成AI、音楽生成AI、テキスト・コード生成AIなどの種類に分けられます。
それぞれにいくつも生成AIサービスがあるため、どのサービスを導入すべきか悩む方もいるかもしれませんが、自社のニーズを満たせるサービスを導入しましょう。

例えばテキスト生成を検討しているのであれば、ChatGPTやGeminiなどが適しています。
生成AI導入を検討しているものの、どのようなサービスを選ぶか迷っている方はTDSEにご相談ください。

TDSEではChatGPTをはじめとした生成AIの導入をサポートしています。

業務や業種ごとに適した生成AI導入のサポートが可能なため、お気軽にご相談ください。

LLM活用支援サービスはこちら

お問い合わせはこちら

お問い合わせ

資料ダウンロードはこちら

サービス資料ダウンロードはこちら