核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
qwen3-0.6B这种小模型有什么实际意义和用途吗?
qwen3-0.6B这种小模型有什么实际意义和用途吗?...(144 )人阅读时间:2025-06-19 01:40:10
为什么美国的肯德基可乐饮料可以免费续杯?
为什么美国的肯德基可乐饮料可以免费续杯?...(144 )人阅读时间:2025-06-19 03:05:10
如果将几百核心的服务器 CPU 当作 GPU 使用,会发生什么?
如果将几百核心的服务器 CPU 当作 GPU 使用,会发生什么?...(144 )人阅读时间:2025-06-19 01:50:10
以色列为什么突然敢打伊朗了?不怕被报复?
以色列为什么突然敢打伊朗了?不怕被报复?...(144 )人阅读时间:2025-06-19 02:40:10