首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

我把「FLUX」接入了「小爱」,微信直接出图,告别一切绘画软件!

  • 25-03-02 10:42
  • 3768
  • 11719
blog.csdn.net

前两天,搞了个微信 AI 小助理-小爱(AI),爸妈玩的不亦乐乎。

  • 零风险!零费用!我把AI接入微信群,爸妈玩嗨了,附教程(下)

最近一直在迭代中,挖掘小爱的无限潜力:

  • 链接丢给它,精华吐出来!微信AI小助理太强了,附完整提示词
  • 拥有一个能倾听你心声的「微信AI小助理」,是一种什么体验?
  • 小爱打工,你躺平!让「微信AI小助理」接管你的文件处理,一个字:爽!
  • 我把多模态大模型接入了「小爱」,痛快来一场「表情包斗图」!不服来战!

有朋友问:小爱能 AI 绘画么?

小爱:害,不过是接个模型的事儿~ 扶我来战!

今日分享,继续带大家实操:如何让小爱理解用户需求,并生成满足需求的图片!

要实现AI 绘画功能,我们先来拆解下步骤:

  • 识别用户意图:从用户输入中识别出AI 绘画的意图;
  • 生成绘画提示词:根据用户输入,生成给绘画模型的提示词;
  • 生成图片:调用图片生成模型的接口,返回图片 url。

1. 识别用户意图

在零风险!零费用!我把AI接入微信群,爸妈玩嗨了,附教程(下)的基础上,我们只需在意图列表中新增一条:图片生成。

提示词如下:

intentions_list = ['天气', '步行规划', '骑行规划', '驾车规划', '公交规划', '地点推荐', '图片生成']
intentions_str = '、'.join(intentions_list)

sys_intention_rec = f'''
  你是意图识别专家,我会给你一句用户的聊天内容,帮我分析出他的意图。
  要求:
  1. 只有当你非常明确意图来自以下类别:{intentions_str},才能回答,否则请回复“其它”。
  2. 直接回答意图标签即可,无需回答其它任何内容。
  '''
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

这样,LLM 从用户输入中识别到图片生成后,就直接路由到指定的处理逻辑。

2. 生成绘画提示词

由于用户输入是非结构化,这就需要提取出和绘画提示词相关的内容。

不过,这事简单,直接交给 LLM 就行,你只需给它合适的角色提示词就行:

if intention == '图片生成':
    messages = [
        {'role': 'system', 'content': '根据用户输入,生成给stable diffusion等图片生成模型的提示词,只回答提示词内容,无需回答其它任何内容'},
        {'role': 'user', 'content': f'{user_content}'}
    ]
    res_prompt = unillm(['gemini-1.5-flash', 'glm4-9b'], messages=messages)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

你别看就这么个简单任务,参数量小一点的模型压根搞不定!

实测下来,还是gemini-1.5-flash靠谱一些,推荐大家使用。

3. 生成图片

有了绘画提示词,终于到最后一步:生成图片了。

用啥模型生成图片呢?

本地部署个 Stable Diffusion?

都 2024 了,AI 绘画的风口在 FLUX 这里,强烈推荐你去体验一下?FLUX + LoRA 实测,AI 绘画开启新纪元,5分钟带你部署体验。

现在 FLUX 的生态已经越来越完善了,但是本地部署对很多小白来说还是有点门槛。

为了让大家能快速跑通流程,我们选用siliconflow提供的免费接口。

核心代码如下,一键接入 AI 绘画模型:

def generate_image(prompt='a cat', model='flux', img_size='1024x576', batch_size=1):
    url = f"https://api.siliconflow.cn/v1/{model}/text-to-image"
    headers = {
        "accept": "application/json",
        "content-type": "application/json",
        "Authorization": "Bearer xxx"
    }
    data = {
        'prompt': prompt,
        'image_size': img_size,
        'batch_size': batch_size,
    }
    response = requests.post(url, json=data, headers=headers)
    img_urls = [img['url'] for img in response.json()['images']]
    return img_urls
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

当然,siliconflow也开放了Stable Diffusion系列模型,不过从实测来看,FLUX 更香,不知大家体验如何,欢迎评论区交流。

如果有更多AI绘画的定制化需求,只能本地部署 LoRA + ControlNet 模型。想咋玩,你说了算!

4. 效果展示

来一波测试案例:

在这里插入图片描述

最后,我们来看下日志:

意图识别没问题!

此外,gemini还会帮我把绘画提示词润色一下。这下,你还担心不会写提示词么?

写在最后

本文通过简单三步为小爱接入了AI 绘画能力。

从此,写公众号,再也不用费劲找封面图了,小爱直出,灵感无限!

大家有更好的想法,欢迎评论区交流。

如果本文对你有帮助,不妨点个免费的赞和收藏备用。

想和小爱互动的小伙伴,可以通过公众号找到我,拉你进群体验。


为了方便大家交流,新建了一个 AI 交流群,欢迎感兴趣的小伙伴加入。

小爱也在群里,想进群体验的朋友,公众号后台「联系我」即可,拉你进群。

猴哥的AI知识库
微信公众号
AI全栈工程师,帮助零基础编程小白入门AI
注:本文转载自blog.csdn.net的AI码上来的文章"https://blog.csdn.net/u010522887/article/details/142074429"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top