过程即奖励

作者

过程即奖励

13
读者
283
内容

每天脑子里的念头都会在这生根发芽 因上努力,果上随缘 | 挥舞剑的人 | journey is the reward lollapalooza

全部文章
作者过程即奖励头像

过程即奖励

2024/09/15

盲目的乐观 只关注终局忽略边际是一种偷懒

作者过程即奖励头像

过程即奖励

2024/09/15

投资 - 右侧与不贪心 环境与表向

投资需要的是笑到最后,活到最后,投资是最不需要逞英雄的领域,不要去对抗市场,对抗市场这个事情本身就很搞笑。顺势而为,是最高的安全边际,管理好风险,投资就成功了一半。

审时度势,见机而......

作者过程即奖励头像

过程即奖励

2024/09/15

大模型 - o1 vs 4o

4个能力 文字表达(甚至多模态生成) 记忆(历史具备知识 和 缓存新知识) 推理 多模态输入识别

4o更多是多模态 o1是推理

用到了更多强化学习的方式去训练,cot内化......

作者过程即奖励头像

过程即奖励

2024/09/09

大模型 - coding的平权

llm让编程这个生产力工具实现平权 所有人都可以让写代码变成自己生产力提升的方式

因为有LLM 甚至是LLM - action的方式 所以完成任务不用复杂逻辑判断

ag......

作者过程即奖励头像

过程即奖励

2024/09/06

大模型 prompt - 代码 - action

有一种思路很有意思, predict next token为基础的LLM在数学运算和输出一些表格等类型输出结果不好, 但是LLM写python可以表现很好。

所以假如......

作者过程即奖励头像

过程即奖励

2024/09/04

大模型 - LLM based 外呼

关于voice agent 和 LLM based语音外呼的看法

和纯文字比主要几个核心点:声纹 / 打断处理 / tts时延 / 整个 asr-llm生成回复-tts工程上的时间延......

作者过程即奖励头像

过程即奖励

2024/09/04

大模型 - 爬虫

因为国内的环境 国外大模型做得非常多的自动爬虫然后总结国内做的都很少

国外sales agent大量是爬虫去确定各种客户背景 增加销售成功率

但是其实 在各种地方都可以应......

作者过程即奖励头像

过程即奖励

2024/09/04

大模型 - agent思考方式

设计产品的时候 更多去想 我在这个场景 如果有一个助手 或者 我自己 希望完成什么工作

然后单独的一个工作 就应该包装成一个agent去完成

任务 - 目标 vs 一大......

作者过程即奖励头像

过程即奖励

2024/09/02

大模型 - 个人数据 和 大模型时代的数据

有大模型之后,个人数据 记录数据的价值将会有巨大的提升

这就意味着:

所有的数据,未来都要被改造成可以被大模型使用的模式

不能被大模型使用,就意......

作者过程即奖励头像

过程即奖励

2024/09/02

大模型 - 实现销售节奏的编排

昨天上了一个线上讨论会,被问对大模型的能力有什么期待(会带来什么不一样的东西)

voice agent 和 全流程ai外呼不谈

更多是实现销售......