各项能力的配置

每项能力背后都需要一个「服务提供方」来实际执行工作。可咚支持两类提供方:

  • 官方服务:登录账号后自动同步,开箱即用,使用官方额度计费
  • 第三方服务:你自己填入 API Key,直接调用第三方平台的接口,费用由第三方收取

你可以在「设置 → 能力」中查看和管理各项能力的服务配置。

大语言模型

这是 AI 对话的核心。登录后会自动同步官方可用的模型列表。你也可以添加兼容 OpenAI 接口的第三方模型(需要填入接口地址和 API Key)。

在对话中可以随时切换当前使用的模型。

网络搜索

用于在对话中搜索互联网信息。官方提供默认搜索服务,你也可以配置第三方搜索 API(如博查搜索等)。配置第三方服务时需要填入对应的 API Key。

远程获取

用于抓取网页内容和下载文件。无需额外配置。

图片生成

支持多个图片生成服务,包括官方提供的以及第三方服务(如即梦、通义万相等)。不同服务支持的图片尺寸和风格可能不同。第三方服务需要填入对应平台的 API Key。

图片识别

用于分析和理解图片内容。官方提供默认服务,也支持配置兼容 OpenAI Vision 接口的第三方服务(需填入接口地址、模型名称和 API Key)。

录音转写

将音频转换为文字。目前仅支持官方服务,登录后自动可用。由于大多数长时间的录音转写服务提供方都需要一个额外的接口来存储音频文件,因此暂不支持第三方的录音转写服务。