甄嬛Chat复现-Part01-从剧本文件提取对话
本文复现:使用extract-dialogue工具从剧本提取对话。 extract-dialogue调用DeepSeek V3 Chat模型API,使用schema预设的样例模板,从剧本txt中提取对话,保持成json格式。 生出的角色对话格式示例: {"role": "甄嬛", "content": "嬛儿是尽...
本文复现:使用extract-dialogue工具从剧本提取对话。 extract-dialogue调用DeepSeek V3 Chat模型API,使用schema预设的样例模板,从剧本txt中提取对话,保持成json格式。 生出的角色对话格式示例: {"role": "甄嬛", "content": "嬛儿是尽...
官方指导:https://huggingface.co/docs/transformers/v4.35.1/zh/serialization 1、下载TinyLLM模型代码 mkdir llmkitgit clone https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0 2、编写export_onnx.py脚本,导出onnx模型 ...
术语: LADE:lookahead decoding缩写。 简介LADA方法介绍:https://lmsys.org/blog/2023-11-21-lookahead-decoding/ LADE GitHub仓库:https://github.com/hao-ai-lab/LookaheadDecoding 测试流程下载并安装: git clone https://github.c...