常见问题解答

Q:为什么有些模型不能看见屏幕?

A:因为不是所有模型都有图像识别能力,例如deepseek大部分系列都不支持 所以要确认好自己的模型是否支持视觉功能

Q:肥牛API每日额度不够用怎么办?

A:后续会退出各种活动、方式获取肥牛API额度 例如开放工具广场后,下载量多的工具会奖励额度补贴等

Q:肥牛是如何触发视觉的?

A:两种触发方式,第一种是直接在肥牛.exe中启动点击"开启默认视觉功能"这个按键 就是下方图片位置

alt text

点击后每次和AI说话,都会附带截屏最新的一张图片一起发送给AI 当然。这种方式可能增加处理延迟,因为图片数据量比纯文本大得多。


另一种就是当前是有个bert模型会分析你说话的语义,每次和AI说话,bert模型都会判断你的这段话里面需不需要我去调用图片处理?如果不需要,那我什么都不做

如果需要,那我就发送一个需要的消息给系统 让它立即截图 然后连同你的回复+截图发送给AI 例如:你觉得这个人怎么样?;你看看他好看嘛?’;我的这些文件乱吗?等等这些文本都可能会触发bert的需要机制

通过这样的方式来智能判断什么时机需要使用截图让模型看见