过程即奖励

作者

过程即奖励

读者

287

内容

每天脑子里的念头都会在这生根发芽因上努力，果上随缘｜挥舞剑的人｜ journey is the reward lollapalooza

全部文章

过程即奖励

2024/09/26

Albert关于时代注脚的播客

大模型时代还在早期充满不确定性 alber给出的答案

找到正反馈的业务通过能打赢的小仗加深积累对ai的理解

做短期做到你可以并行做长期的时候再做长期

<......

过程即奖励

2024/09/26

大模型公共知识 vs 私人数据

大模型是所有人都可以用的公共知识就是生产工具的平权。

真正有价值的是你的独特性，而你的独特性正是来自你的私有数据、你的独特知识。

过程即奖励

2024/09/25

企业落地AI 核心能力积累

核心竞争力积累为下面几个：

1. 数据资产，这个的定义是定义：未来可用的数据才叫数据资产（数据资产是不是优质的判断：是不是可以快速呗......

过程即奖励

2024/09/22

大模型 -- 硬件

我们确实需要一个不用从口袋里拿出来、又具备所有 AI 所需传感器的设备。

特别是满足细分需求..

在大模型时代大家大大低估了传感器的价值

过程即奖励

2024/09/15

盲目的乐观只关注终局忽略边际是一种偷懒

过程即奖励

2024/09/15

投资 - 右侧与不贪心环境与表向

投资需要的是笑到最后，活到最后，投资是最不需要逞英雄的领域，不要去对抗市场，对抗市场这个事情本身就很搞笑。顺势而为，是最高的安全边际，管理好风险，投资就成功了一半。

审时度势，见机而......

过程即奖励

2024/09/15

大模型 - o1 vs 4o

4个能力文字表达（甚至多模态生成）记忆（历史具备知识和缓存新知识）推理多模态输入识别

4o更多是多模态 o1是推理

用到了更多强化学习的方式去训练，cot内化......

过程即奖励

2024/09/09

大模型 - coding的平权

llm让编程这个生产力工具实现平权所有人都可以让写代码变成自己生产力提升的方式

因为有LLM 甚至是LLM - action的方式所以完成任务不用复杂逻辑判断

ag......

过程即奖励

2024/09/06

大模型 prompt - 代码 - action

有一种思路很有意思， predict next token为基础的LLM在数学运算和输出一些表格等类型输出结果不好，但是LLM写python可以表现很好。

所以假如......

过程即奖励

2024/09/04

大模型 - LLM based 外呼

关于voice agent 和 LLM based语音外呼的看法

和纯文字比主要几个核心点：声纹 / 打断处理 / tts时延 / 整个 asr-llm生成回复-tts工程上的时间延......