ChatBase使用教程

TangLu 未命名 2023-07-29 272 0

一、ChatBase基本信息

ChatBase 是一款基于 ChatGPT 模型为底座(默认使用gpt-3.5-turbo模型,支持付费升级gpt-4)、可快速部署AI聊天机器人的商业化产品。支持用户导入自己的PDF、URL、Q&A、纯文本等多种格式的文档作为数据集对GPT进行快速训练(最高400万字符),在短时间内就可以获得一个能回答私有领域问题的聊天机器人,而且可以将聊天小部件添加到自己的网站中。


二、ChatBase使用说明

1、注册与登录ChatBase

访问 https://www.chatbase.co/,进行注册与登录,如图

chatbase1.jpg


2、创建聊天机器人

2.1 不同的订阅计划可创建的机器人数量不同,创建前需要做好规划

chatbase2.jpg


2.2 建议分业务创建,避免训练数据混淆

chatbase3.jpg


3、机器人设置

进入创建的机器人设置界面,为机器人进行个性化设置,可设置内容包含:

3.1 Chat Interface

用于设置机器人嵌入页面后的展示信息

chatbase9.jpg


3.2 General

用于设置机器人调用的模型、prompt、Temperature等重要参数

chatbase5.jpg



4、上传与训练数据

注:在大模型领域中的预训练阶段才算严格意义的"训练",而日常对大模型微调与向量化技术上的"训练"都属于广义泛指

4.1 上传数据

按需上传数据集进行训练,其中Files代表附件格式,支持pdf\doc\txt等;Text为纯文本内容、Website可以通过URL爬取页面、Q&A为直接设置问答对

chatbase10.jpg


4.2 训练数据

上传数据后一定要点击训练按钮才会生效

chatbase6.jpg


5、使用机器人

数据训练完成后进行问答测试,可以通过Sources查看内容出处,便于对部分错误问答进行数据集侧的修正

chatbase10.jpg


三、ChatBase使用结论

1、优点

· 配置简单,使用技术门槛低

· 支持多种格式的数据集

· 训练速度快

· 支持GPT3.5与GPT4两种模型


2、不足

· 收费相对较贵

· 暂时无法对向量化过程中的参数进行灵活设置

· 无法对大模型底座进行训练

· 暂时无法使用GPT插件


评论