跳到主要内容

RAG 问答

基于已上传的知识库文档进行检索增强问答。接口会检索相关文档分块,组装上下文,然后调用指定大语言模型生成回答。

Try It

POST/search/chat_messagehttps://api-platform.ope.ai

认证

使用 Bearer Token 认证。

  • Header:Authorization: Bearer <token>
  • 示例:Authorization: Bearer sk-xxxxxx

请求体(application/json)

字段类型必填说明默认值 / 范围
questionstring用户问题,将用于文档检索和回答生成-
llm_model_namestring用于生成回答的大语言模型名称-
embedding_model_namestring用于文本向量化和检索的 Embedding 模型名称-
session_idstring会话 ID,用于关联对话历史-
top_kinteger检索返回的相似文档数量默认 5
streamboolean是否使用 SSE 流式响应默认 true
return_sourcesboolean是否返回相关源文档默认 true
return_historyboolean是否返回历史对话记录默认 false
extra_promptstring附加提示词,用于补充回答约束默认
example_promptstring示例提示词,用于约束回答风格默认示例
fallback_contextstring知识库无相关内容时的备用上下文默认空字符串
cosine_radiusnumber余弦相似度阈值半径默认 0.55

请求示例

curl -X POST "https://api-platform.ope.ai/search/chat_message" \
-H "Authorization: Bearer $OPEAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"question": "什么是 RAG?",
"llm_model_name": "deepseek-v4-flash",
"embedding_model_name": "bge-m3",
"top_k": 5,
"session_id": "session_1",
"stream": false,
"return_sources": true
}'

响应示例

{
"message": "RAG 是检索增强生成,会先从知识库中查找相关内容,再结合模型生成回答。",
"sources": [
{
"doc_id": "doc_1",
"chunk_id": "chunk_1",
"content": "RAG combines retrieval with generation."
}
],
"info": {
"top_k": 5
},
"history": []
}

错误响应

状态码场景说明
400参数验证错误问题、模型、会话等必要字段缺失或格式不正确
401鉴权失败API Key 缺失、无效或权限不足
422参数校验失败参数结构校验失败
500处理失败数据库、检索、模型调用或其他服务端错误