-
- 投稿日
- 2024.09.27
-
- 更新日
- 2024.09.27
生成AIは、顧客や社内従業員からの問い合わせ対応、資料作成など、さまざまな場面で活用可能です。
生成AIサービスは、大きく分けて画像生成AI、動画生成AI、音声生成AI、音楽生成AI、テキスト・コード生成AIの5種類があります。
生成AIをビジネスシーンで活用するためには、サービスごとに得意としている分野を把握することが大切です。
本記事では生成AIサービスの種類について解説します。
またおすすめのサービスも紹介するので、どの生成AIサービスを導入しようか悩んでいる方は、ぜひ参考にしてください。
目次
生成AI の種類一覧と各サービスの紹介
生成AIの種類は、大きく次の5種類に分けられます。
- 画像生成AI
- 動画生成AI
- 音声生成AI
- 音楽生成AI
- テキスト・コード生成AI
生成AIはサービスごとに得意としている分野が異なります。
そのため、自社の目的に応じた生成AIサービスを導入しましょう。
画像生成AI
画像生成AIを活用すると、画像やイラストを生成可能です。
例えば企業ロゴや商品画像の作成などに活用できます。
画像生成AIには、主に次のようなサービスがあります。
- Stable Diffusion
- Midjourney
【Stable Diffusion】商用利用が可能
Stable Diffusion(ステーブル・ディフュージョン)はイギリス発の画像生成AIです。
Stable Diffusionはソースコードが公表されているオープンソースのため、Webもしくはオフラインで利用できます。
オフラインでの利用はデバイスのスペックが限定されるものの、Web版であればインターネット環境が整っていれば誰でも利用可能です。
Stable Diffusionは、希望するイメージをテキストとして入力するだけで画像を生成できます。
さらに生成した画像は商用利用が可能です。
【Midjourney】プロンプトの非表示が可能
Midjourney(ミッドジャーニー)はアメリカで開発された画像生成AIです。
Midjourneyでは次のような4つの有料プランが用意されています。
- Basic Plan
- Standard Plan
- Pro Plan
- Mega Plan
このうちPro Plan、Mega Planはステルスモードが使用可能です。
ステルスモードであれば、自分が生成AIに出した指示(プロンプト)を非表示にできます。
なおMidjourneyも一定の条件を満たすことで、商用利用が認められます。
動画生成AI
動画生成AIを活用すると、テキストや画像から動画を自動で生成可能です。
また動画の編集も動画生成AIによって行えます。
生成した動画は、プロモーションなどに活用できます。
動画生成AIサービスとして主に以下が挙げられます。
- Sora
- Runway Gen-2
【Sora】OpenAI社が開発した動画生成AI
Soraは、ChatGPTで知られるOpenAI社が開発した動画生成AIです。
Soraはプロンプトとしてテキストを入力するだけで、最長1分間の動画を作成できます。
しかし、2024年9月時点で日本ではリリースされていません。
【Runway Gen-2】画像からでも動画生成が可能
Runway Gen-2は、アメリカ・ニューヨークを拠点とするRunway社が手掛ける動画生成AIです。
Runway Gen-2はテキストから動画を生成できるだけではなく、画像を動画にすることも可能です。
Runway Gen-2は無料で利用可能なプランに加えて、4つの有料プランが展開されており、プランごとに生成可能な動画の本数が異なります。
なおRunway Gen-2に次ぐモデルとして、2024年6月にはGen-3 Alphaがリリースされました。
音声生成AI
音声生成AIは、音声や音楽、動画などを学習して音声を作り出すAIです。
コールセンター対応や、音声で回答する音声ボットなどでの活用が期待されています。
主な音声生成AIサービスとして挙げられるのは以下の通りです。
- Text-to-Speech AI
- VALL-E
【Text-to-Speech AI】Googleが提供する音声生成AI
Text-to-Speech AIはGoogleが提供している音声生成AIで、テキストをスムーズな音声として生成可能です。
スタジオで録音されたかのような音質のため、動画のナレーションとしても活用できるでしょう。
Text-to-Speech AIは、生成した音声の文字数に応じて料金が変動します。
【VALL-E】Microsoftが手掛ける音声生成AI
VALL-EはMicrosoftが手掛けた音声生成AIで、独自の技術、ニューラルコーデック言語モデルが採用されています。
日本語に対応しているのはVALL – E Xで、英語や中国語への翻訳にも対応可能です。
また、EmoV-DBと呼ばれる感情データベースをサンプリングすると、情感がこもった音声を生成可能です。
音楽生成AI
音楽生成AIは大量の楽曲データを学習し、メロディやハーモニー、リズムなどを分析してオリジナルの音源を生成します。
音楽生成AIを活用すれば専門的な知識がなくとも、コストを抑えてオリジナル音源を制作可能です。
音楽生成AIとして以下が挙げられます。
- Suno AI
- MusicLM
【Suno AI】テキストによって音楽の生成が可能
Suno AIは、アメリカのマサチューセッツ州に拠点を構えるチームが手掛ける音楽生成AIです。
Suno AIは開発に音楽家やAIの専門家が関わっていて、テキストを入力するだけでさまざまな楽曲を生成可能です。
Suno AIには無料プランと有料プランがあります。
無料プランは商用利用が認められない上に、制作可能な音源数が有料プランよりも少なくなります。
【MusicLM】Googleによる音楽生成AI
MusicLMは、Googleが発表した音楽生成AIです。
MusicLMはプロンプトとして、ジャンルやテンポ、ムードを生成AIに伝えることで音楽を生成してくれます。
一度に2曲を生成可能で、完成した楽曲はダウンロードが可能です。
テキスト・コード生成AI
テキスト・コード生成AIでは、自動でテキストやプログラミングコードを生成可能です。
例えば社内や顧客からの問い合わせに対して、テキストで自動返信できます。
テキストやプログラミングコードを作り出せる生成AIとして、主に以下が挙げられます。
- ChatGPT
- Gemini
- Claude
【ChatGPT】基本無料で利用可能
OpneAI社が手掛ける生成AIがChatGPTです。
2022年にGTP-3.5がリリースされ、多くのユーザーが利用しました。
その後、2023年にはより精度の高いGPT-4がリリースされたことで、より広く知られるようになりました。
ChatGPTは基本無料で利用できるものの、より高精度の機能を求めるのであれば、有料のChatGPT Plusを利用すると良いでしょう。
【Gemini】Googleが開発した生成AI
GeminiはGoogleが開発した生成AIです。
Googleが開発した生成AIは従来、Google Bardと呼ばれていましたが、2024年にGeminiへ名称が変更されました。
GeminiはGoogleが手掛けているためリサーチに長けており、専門性の高いテキスト作成が期待できます。
GeminiはGoogleアカウントがあれば無料で利用可能です。
より高い精度を求めるのであれば、有料のGemini Advancedを検討しましょう。
【Claude】複雑なタスクにも対応
ClaudeはアメリカのAnthropic社が開発した生成AIです。
Claudeは次の通り、基本無料または有料の3つのプランがあります。
- Sonnet:基本無料
- Opus:有料
- Haiku:有料
有料プランのうち、Opusは複雑なタスクを、Haikuはスピーディな回答を得意としています。
生成AIサービスでコンテンツを生成する際の注意点
生成AIサービスを活用すれば画像や動画、音楽などさまざまなコンテンツをスピーディに生成可能です。
しかし、生成AIサービスでコンテンツを生成する際は、次のような点に注意しましょう。
- 著作権を侵害している可能性がある
- 誤った情報を提供する可能性がある
著作権を侵害している可能性がある
生成AIサービスでコンテンツを生成する際、著作権を侵害している可能性があります。
生成AIサービスは事前にした学習した情報をベースにコンテンツを生成します。
そのため、学習情報に著作物が含まれている場合、類似したコンテンツを生成しかねません。
著作権を遵守するためには学習データが偏らないようにする、他人の著作物を学習させないなどの対策を講じましょう。
誤った情報を提供する可能性がある
生成AIによって提供される情報は誤っている可能性があります。
このように生成AIの情報が誤ってしまう理由は、学習データの量や質などが原因です。
誤った情報を受け取らないためにも、ファクトチェックの体制を整えましょう。
生成AIは自社のニーズに合ったサービスを導入しよう
生成AIは、画像生成AI、動画生成AI、音声生成AI、音楽生成AI、テキスト・コード生成AIなどの種類に分けられます。
それぞれにいくつも生成AIサービスがあるため、どのサービスを導入すべきか悩む方もいるかもしれませんが、自社のニーズを満たせるサービスを導入しましょう。
例えばテキスト生成を検討しているのであれば、ChatGPTやGeminiなどが適しています。
生成AI導入を検討しているものの、どのようなサービスを選ぶか迷っている方はTDSEにご相談ください。
TDSEではChatGPTをはじめとした生成AIの導入をサポートしています。
業務や業種ごとに適した生成AI導入のサポートが可能なため、お気軽にご相談ください。
LLM活用支援サービスはこちら
お問い合わせはこちら
資料ダウンロードはこちら