Multi:Verse

基于AI多智能体的对话交互沙盘模拟

AdventureX 2025 All We Do 何以为人有赞

展位13

代码eth-rbt/advx↗

✦部分内容由 AI 协助补全

/ 获奖01 项

AI 导购和销售培训子赛道优胜

AI 智能销售力赛道（AI Smart Sales Force Track）

Partner 赛道

/ 项目简介

基于AI多智能体的对话交互沙盘模拟

/ 媒体 · 4

/ 详情

MultiVerse：何以为人？面对不确定性的勇气

Two roads diverged in a wood, and I—I took the one less traveled by. ------The Road Not Taken, Robert Frost

核心功能：AI多路径决策沙盘

用户输入：定义场景和角色的 system prompt

核心交互：以 A-B-A-B... 形式展开对话

2. 奖励模型决策：使用奖励模型（RM）对选项评分排序，选择最优输出

循环上述过程，生成完整对话（8-10轮）

3.多轮模拟：重复上述过程3-4次，生成不同发展路径

前端交互系统：

1.主干：RM选择的最优路径

2.分支：所有备选回复及评分

3.回溯：可跳转至任意节点修改内容或选择新分支

关键能力：提供了对话决策过程的视图，不仅展示“最优解”，更揭示了“为什么这是最优”以及“其他选择为何不好”。

核心痛点与解决方案

痛点1：System Prompt调试困难

现状问题：传统AI对话中，用户凭直觉修改几个词，难以预测对复杂多轮对话的级联影响。结果不满意时，只能在黑箱模型中反复试错。

突破：

1.可视化影响链：修改 prompt 后，整个决策图谱动态更新，直观追踪修改如何影响每轮的选项生成、RM评分和最终走向。并且也会保留分数相对较低的分支以供分析

2.精准定位问题：对话"跑偏"时，直接定位到具体决策点的问题（生成选项不够好？还是RM评分有偏差？），精准调整而非盲目重试

痛点2：中间节点调试困难

现状问题：即便能定位错误的节点，当该轮对话不理想时，依然只能要么接受要么重来，成本高昂。缺乏中途非破坏性探索（"如果换种说法会怎样？"）和针对性修正能力。

突破：

1.时光回溯与分支创造：随时"回到"任意历史节点

a.修正历史：直接编辑节点内容，实时重新生成后续路径，展示"如果当时这样说..."的平行宇宙

b.探索分支：手动选择之前被淘汰的选项，生成该选项下的完整后续路径

2.动态增删与局部优化：支持中途插入或删除对话轮次，智能衔接上下文，支持任意节点反事实重建，实时生成新路径树，提供无与伦比的灵活性和探索性。

核心应用场景与商业模式示例

场景简介:

模拟新人销售面对不同类型的难缠客户时的真实对话。新人可以安全地练习高阶销售技巧（如挑战者销售法），而不是用真实的百万大单当学费。RM根据“获取会议概率”、“客户信任度”等指标实时评分，并反复进行“反事实推演”

目标群体:

核心付费方: 大型科技公司、金融服务、医药器械等高客单价行业的销售副总裁和销售赋能部门

直接用户: 企业销售团队，特别是入职1-3年的初中级销售。

商业模式:To B - 企业级SaaS订阅

回扣主题：何以为人——面对不确定性的勇气

我们必须承认，以next-token prediction为基石的LLM，其本质是一个概率的囚徒。它被海量数据训练，去寻找那条阻力最小、最符合统计规律的“最优路径”。它的智慧，是寻找最大公约数的智慧；它的决策，是通往最高概率的决策。这是它的优越之处，却也是它无法逾越的天花板。它能模拟一个最可能让客户满意的销售，一个最可能安抚病人的医生，但它永远无法真正“理解”选择本身。它呈现的，是一个被数据精心计算过的、看似完美却缺乏灵魂的“唯一解”。

而MultiVerse的使命，恰恰是打破这种“唯一解”的幻象，将隐藏在概率之下的、充满可能性的广阔平行宇宙，完整地呈现在你的面前。

何以为人，我们用“情感的伟力”为次优选择赋予意义；

何以为人，我们在“别无选择”中艰难做出选择的勇气；

MultiVerse无法替你成为英雄，但它可以为你展示所有通往平庸的道路，从而让你看清，那条通往英雄主义的道路，究竟需要付出何等的代价与勇气。

而这，也是人之所以为人的答案。

/ 技术栈

旅行编程教学文化安全与隐私 AI对话多智能体金融 Web3

/ 团队

熊

熊大

提交者

Ethan