【漫画】画像生成AIの実力は? 大反響『サイバーパンク桃太郎』作者がXに新作投稿、創作背景を聞く

――制作の経緯から聞かせてください。

Rootport:投稿したのは過激な表現を抑えたバージョンなんです。京都で人肉料理を実際に作るという漫画を商業誌に持ち込んだら、どの出版社にもNGで……(笑)。

 それを受けて、過激な表現を抑えながら脚本を1から練り直した結果、少し冗長になった気もします。個々の要素は面白いとは思うんですけどね。再度の持ち込みもしましたが、いい結果には繋がらないと感じてXで供養した形です。

――ストーリーの着想はどこから?

Rootport:個人的に人類学や進化心理学が好きなんですよ。特に本作については、文化人類学者・マーヴィン・ハリスの著作『食と文化の謎』などから影響を受けました。学者さんに深い知識では敵いませんが、原作者として浅くても広い見識を持とうと心がけています。

――『サイバーパンク桃太郎』は「Midjourney」を画像生成で使用されたとのことですが、本作は何を使用されました?

Rootport:「Stable Diffusion」を画風を調整して使っています。背景は京都で撮った写真から起こしているコマも結構ありました。『サイバーパンク桃太郎』を描いていた1年半前に比べると作業効率は各段にアップしています。

 当時のMidjourneyではDiscordでプロンプトを打ち込むと30秒ほどで4枚のスピードでしたが、Stable Diffusionなら今の私の環境では20秒ほどで8枚生成できます。さらにPC2台体制ですから随分と早くなりました。とはいえ、約20日間かかったので思ったより長引いた印象です。

――制作における苦労した点はありましたか。

Rootport:まだ画像生成では表情が硬いなと思います。「泣き顔」と入れて出てきた80枚くらいから1番いい画像を使用しますが、漫画家さんが描くものに比べてイマイチ。クオリティを求めるなら手が早い書き手の方が全然早いと思います。まだまだ100%AIで漫画を作るのはハードルが高いなと。

――ぜひ使用したプロンプトの例をひとつ教えてください。

Rootport:英語で500字くらいは入れます。しばしば「呪文詠唱」と呼ばれるのも無理ないかなと思います。例えば61ページ面の最初のコマは「(masterpiece, best quality, ultra detailed), a girl jumping, holding a fork, black choker, short silver hair, short bob hair, cat girl, cat ears, loli, flat chest, two cat tails, closed eyes, blush smile, happy, (oversized_clothes, oversized_shirts, T-shirts), monochrome, lineart, /Negative prompt: (worst quality:1.4), (low quality:1.4), censorship, (watermark, words, text)+, ugly, mutation, multi-limbs, missing fingers, extra fingers, bad composition, inaccurate eyes, extra digit, fewer digits, trembling, hearts, hood, hat, (pants, dress), closed mouth,」だったり。元々ブロガーからキャリアをスタートしたので、プロンプトを組むこと自体は苦ではありませんし、直観的に考えられます。

――漫画制作と生成AIについての現状についてどう見ています?

Rootport:現行の連載作品を読んでいると、表明せずとも使っていると思われる漫画家さんが増えました。だろめおん先生や、うめ先生のように、既に使用を公表されている先生もいます。普及の流れは止まらないと思います。

関連記事