booklista tech blog

booklista のエンジニアリングに関する情報を公開しています。

ショートマンガ創作支援サービスに画像生成 AI(DALL·E 2)を導入した話

アイキャッチ

初めまして。

株式会社ブックリスタで、ショートマンガ創作支援サービス(YOMcoma)のフロントエンド開発を担当している前田と申します。

今回 YOMcoma に、DALL·E 2 を導入しましたので経緯も含めてお話させて頂きます。

最近はYOMComaコミック機能がリリースされました。

YOMcomaコミック機能とは、投稿したマンガを紙のコミックとして販売できる機能です。

アプリからご購入できますので、ぜひ一度見ていただけると嬉しいです。

目次

DALL·E 2 とは

今回導入させていただいた DALL·E 2 について、簡単に説明させていただきます。

昨今、様々な生成 AI が誕生していますが、その中でも注目度が高い画像を生成する AI です。

画像生成が注目され始めたのは Nvidia の研究者によって開発された StyleGAN が登場した 2019 年頃です。

そのクオリティの高さから、AI による画像生成が注目されていきました。

そんな中、2021 年 1 月、AI の研究組織である OpenAI が 2021 年 DALL·E を発表し、その後 2022 年 4 月に DALL·E 2 を発表しました。

テキストを入力するだけで、その内容に近い画像が作られることで大きな反響を呼びました。

そして 2022 年 11 月に DALL·E 2 の API が開発者向けに提供されました。

スクリーンショット (DALL·E 2 によって作成された様々なタッチの画像)

導入経緯

YOMcoma は、作品を読んだ際に閲覧者は「いいね」や「シェア」ができます。

その際、投稿者はお礼メッセージと合わせて画像も追加できます。

ただし、この画像は投稿者が YOMcoma のために作る必要がありました。

この画像を AI によって作成できたら、投稿者の負担が少し減るのではないかと思いました。

そこで、DALL·E 2 の導入を提案し実装させていただくことになりました。

DALL·E 2 の API について

DALL·E 2 の API には、下記のパラメータが用意されています。

curl https://api.openai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "prompt": "A cute baby sea otter",
    "n": 2,
    "size": "1024x1024",
    "response_format": "b64_json",
    "user": "user123456"
  }'
名前 説明
prompt 生成したい画像のテキスト説明です。最大長は1000文字です。
n 生成する画像の数です。1から10の間で指定します。デフォルトは1です。
size 生成される画像のサイズです。256x256、512x512、または1024x1024のいずれかを指定します。デフォルトは1024x1024です。
response_format 生成された画像の返される形式です。urlまたはb64_jsonのいずれかを指定します。デフォルトはurlです。
user エンドユーザーを表す一意の識別子です。これにより、OpenAIが監視し、乱用を検出するのに役立ちます。

画像生成の API を利用するに辺り大きく 2 つの点に注意する必要があります。

  • prompt の記載は英語ではなくてはなりません。
  • 公序良俗に反する使い方をするとエラーになり、最悪アカウントを停止される可能性があります。

ただし、こういった注意点を投稿者が理解しながら作るにはハードルが高いと思いました。

なので、こちら側で公序良俗に反しない prompt のパターンを用意し、投稿者に選んでもらうようにしました。

下記がその選択をする UI になります。

そして「描いて欲しいイメージのキーワード」と「イメージのスタイル」を選択します。

最後に生成ボタン(🤖)のアイコンを押す事により、選択した画像を生成できます。

予め用意されたパターンを選ぶだけなので、英語で入力する必要もなくなります。

prompt について

prompt を送信する際に、対象物をどのように書かせるかを具体的に書くとよりイメージに近い画像を生成出来ます。

例えば、単純に「sky」と prompt を送信した場合、下記のようなリアルな絵になります。

これを例えば「sky, oil painting」と入力すると、油絵の空になりました。

ゲームのような空を描かせたい場合は「sky, digital art, cyberpunk」と入力するとゲームのワンシーンのような絵が作られました。

このように「対象物, 対象物の条件, 対象物の条件...」と描いていくとよりイメージに近い画像が作れますので、ぜひお試し下さい。

また他の画像生成 AI にも同じ prompt 「sky, digital art, cyberpunk」を送信し比較してみたので、ぜひ参考にして下さい。

Midjourney

Stable Diffusion

Novel AI

Adobe Firefly

ユーザーからの反響

画像生成を使ったユーザーから「今後、もし自分の絵柄を反映した画像が生成できるようになったら、非常に魅力的だと思いました」などのフィードバックが来ておりました。

今後も投稿者の反応やご意見をもとに、創作に役立てるような仕組み作りをしていきます。

まとめ

会社としてトレンドの AI をこうやって積極的に導入できた事は、非常にプラスだと思いました。

2022 年の末は ChatGPT が話題になり、2023 年の 2 月には ChatGPT Plus が登場し、今年は AI 元年になるとも言われています。

実は今回 DALL·E の話だけでしたが、その GPT 使用した機能も追加しております。

こちらも次回書ければと思っています。

YOMcoma は 0→1 で作っており、様々な機能を試しに導入し、ユーザーからのフィードバックを得て日々改善を繰り返しています。

今後ともご支援賜りますようお願い申し上げます。

以上、読んでいただきありがとうございました。