Skip to content

提示词工程实践

提示词工程是人机交互的艺术,同时也让我们学会如何正确提问问题。

前言

目前互联网上有太多提示词教程,为不同的情境和任务设定了模板,故作玄虚,营销知识焦虑,知识付费割韭菜,不少央企国企还被合法上当受骗。

现在我们学习提示词工程的初衷是为了更好地使用大语言模型,先不说提示词工程是否对大模型交互有显著帮助,推崇用固定的思维框架去驯化人类提问方式,这本身是本末倒置的

当下大模型算法更替频繁,不存在标准的提问规范,但我们可以通过理解自然语言处理(NLP)技术及其原理,通过思维链(CoT)、样本提示、文本结构化标记等方法,使得大模型能更好地理解用户指令的完整含义。


推理模型还需要用提示词工程吗?

提示词工程本质上是一种与大模型交互以完成特定任务的过程,最大限度地激发模型潜力,实现普通方法难以达成的目标,通过与模型“对话”来引导它完成预期目标。

  • Deepseek 的横空出世,让很多人认为没必要继续使用提示词工程了,因为 R1 能自动做上下文联想,补全并自动生成思维链。例如数学、物理等基础学科比较接近于纯粹的形而上学,数学命题是自带逻辑的公理体系,不可被证伪,而物理学理论依赖于实验验证,属于经验科学,但其数学基础和理论假设仍然依赖于符号,人类对数学和物理的抽象理解都是无法直接在现实中用直觉感知到。因此,基础学科的内容和含义都能完全用文字和符号表述,这是以自然语言处理(NLP)为基础的大模型最擅长的领域。所以向大模型提问基础学科的问题,即使使用纯粹的零样本提示或简单有限提示也能获得较好的结果;

  • 如果用户提问的问题是涉及到社会科学、道德伦理等领域,很多问题要么是不可被直接证伪,要么是相对主义的,没有绝对的对与错,只有因立场不同、条件差异而相互对立的哲学学说,在相对的思维模式下,价值观和伦理学只能发挥有限的作用。所以问题的答案需要视特定的个体的价值观、伦理观、意识形态所决定,当一个问题没有绝对或统一的答案时,问一个问题时应该尽可能将具体情景交代清楚。

INFO

你是一位经济学家,有一个发达国家,在高汇率、高财政赤字、高利率的情况下,央行持续推动 QE,并在二级市场持续买债,为了维持不可持续的财政支出,央行间接与政府债务直接换手,造成财政赤字货币化。这被看作是大规模的刺激经济,当经济陷入衰退和通缩(CPI 连续一年同比为负数、平减指数同比也是负的、真实 GDP 没有增长陷入停滞),你需要用多种不同的经济学流派的观点看待这个问题,并输出不同学派会得到怎样的结论,请逐步思考。

Details

针对这一复杂的经济情境,不同经济学派会基于其理论框架提出不同的分析和政策建议。以下是各主要学派的观点总结:


1. 凯恩斯主义(Keynesian)

  • 核心逻辑:有效需求不足导致衰退,需政府干预刺激需求。
  • 分析
    • 支持央行 QE 和财政赤字货币化,认为这是对抗通缩的必要手段。
    • 高利率可能削弱政策效果,需通过更大规模的财政支出(如基建、社会福利)直接创造需求。
    • 通缩环境下,财政扩张不会引发通胀失控。
  • 批评:长期赤字货币化可能导致政府过度依赖央行,削弱财政纪律。

2. 货币主义(Monetarist)

  • 核心逻辑:货币供应是经济波动的根源,主张稳定货币增长。
  • 分析
    • 反对持续 QE,认为货币超发未来可能引发恶性通胀(尽管当前通缩)。
    • 高利率反映市场对通胀或债务风险的预期,QE 扭曲利率信号。
    • 应停止干预,通过规则化货币政策(如固定货币增长率)恢复信心。
  • 批评:忽视结构性问题和流动性陷阱的可能。

3. 新古典学派(New Classical)

  • 核心逻辑:市场自发均衡,理性预期抵消政策效果。
  • 分析
    • 财政赤字货币化会被公众预期为未来增税或通胀,导致私人部门减少支出(李嘉图等价)。
    • 高汇率和高利率是市场对政策不信任的信号,需财政紧缩和结构性改革。
    • 主张减税、放松管制以释放市场活力。
  • 批评:低估短期经济痛苦的代价。

4. 奥地利学派(Austrian)

  • 核心逻辑:经济危机源于人为扭曲(低利率、信贷扩张)。
  • 分析
    • QE 和赤字货币化是“饮鸩止渴”,延长了上一轮泡沫的调整期。
    • 高利率是市场纠正此前扭曲的必然过程,应允许“创造性破坏”。
    • 建议立即停止 QE,接受短期衰退以彻底清算不良投资。
  • 批评:政策建议可能导致深度萧条和社会动荡。

5. 现代货币理论(MMT)

  • 核心逻辑:主权货币国家不会违约,财政空间由实际资源决定。
  • 分析
    • 支持财政赤字货币化,认为通缩表明经济存在闲置产能,应继续扩大支出直至充分就业。
    • 高汇率可通过资本管制或定向政策调整,而非紧缩财政。
    • 通胀风险仅在资源瓶颈时出现,当前无需担忧。
  • 批评:可能忽视国际资本流动对汇率的冲击。

6. 后凯恩斯主义(Post-Keynesian)

  • 核心逻辑:不确定性主导经济,金融脆弱性是关键风险。
  • 分析
    • 支持财政刺激,但认为 QE 加剧财富不平等(推高资产价格)。
    • 需直接创造就业(如就业保障计划),而非依赖金融市场传导。
    • 高利率反映金融部门对政府偿债能力的怀疑,需加强金融监管。
  • 批评:政策执行依赖复杂的制度设计。

7. 结构主义(Structuralist)

  • 核心逻辑:经济问题根植于产业结构与制度缺陷。
  • 分析
    • 单纯货币和财政刺激无法解决深层问题(如产业空心化、技术停滞)。
    • 高汇率暴露竞争力不足,需产业升级和贸易政策调整。
    • 建议将赤字支出定向用于教育、科技和绿色转型。
  • 批评:结构性改革见效缓慢,难以应对短期危机。

8. 新凯恩斯主义(New Keynesian)

  • 核心逻辑:市场存在粘性,需政策微调以实现短期稳定。
  • 分析
    • 支持短期 QE 和财政扩张,但需明确退出机制以避免通胀预期脱锚。
    • 高利率可能源于风险溢价,央行需通过前瞻指引管理预期。
    • 建议“财政主导”与“货币主导”政策协调,中期转向财政整固。
  • 批评:政策协调难度大,易受政治周期影响。

共识与分歧

  • 共识:通缩和停滞表明当前政策组合效果有限,需调整。
  • 分歧
    • 干预派(凯恩斯、MMT、后凯恩斯):继续或加大刺激。
    • 市场派(货币主义、新古典、奥地利):停止干预,恢复市场功能。
    • 改革派(结构主义、新凯恩斯):平衡短期刺激与长期转型。

政策启示

  • 短期:凯恩斯与 MMT 主张的定向财政刺激可能缓解通缩。
  • 中期:新凯恩斯和结构主义强调退出 QE 路径与结构性改革。
  • 长期:奥地利和新古典警告依赖货币化赤字的风险,需重建财政纪律。

各学派的争议本质在于对市场自我调节能力、政府角色和债务可持续性的不同信念,实际政策需折衷取舍。

  • 随着大模型参数量上涨,以及“顿悟时刻”的到来,大模型对世界的理解也逐渐加深,很多时候没必要通过“虚构情境”来引导它们完成任务了。当模型能够理解任务时,更建议倾向于直白、真实地描述目标,这样更有效率。当无法用三言两语概括现实情景时,角色扮演类提示词能用简短的语言使得大模型理解特定的任务情景,所以在没有造成角色和任务冲突、增加冗余的情况下,使用角色扮演提示词是能帮助我们缩小提示词输入,提高交互效率;

综上所述,提示词工程是一门人机交互的艺术,同时也让我们学会正确地提问问题

需要注意的是,目前一般认为蒸馏模型(Distill)中的学生模型(如 Deepseek R1)不需要使用系统提示词。

TIP

模型蒸馏是一种将大型机器学习模型中蕴含的知识转移到较小模型的过程,旨在部署一个较小的、计算量较低但性能仍然良好的模型。该过程通过训练小模型去学习大模型的软输出(伪概率),而非仅仅学习硬分类标签,从而使小模型能够获取大模型内部编码的底层知识表示。

对话系统主要包含三个核心角色:

用户(User):需求发起方,通过自然语言指令明确任务目标(如生成诗歌、设计剪纸方案等)

助手(Assistant):模型执行端,根据用户输入进行响应输出

系统(System):隐式控制层,通过 API 参数预设模型行为特征与响应规则,指的是使用系统角色注入提示词,如提示词要求角色扮演、控制内容主题、思考逻辑等系统层指令

how-to-prompt.jpg

Details

系统:

你是一位金融分析师,你将收到一份研报。研报的标题应该让金融消费者对研报的主题有一个很好的了解,能体现其专业水平,但也应该引人注目,标题和摘要要让普通投资者一眼就能读懂,尽可能简单表述,无需长篇大论或引用过多数据,可以有适当数据,但要阐述清楚研报正文的主旨,请一步一步思考,最后输出五种不同适合该研报的标题和摘要。

用户:

"研报内容" + “你的微调指令”

硅基流动能调用系统提示词和 API 参数进行微调,我输入了一段中金研报的内容,希望它能产生更像人话的内容。需要调高 Temperature 和 Frequency Penalty 来增加输出随机性,使得它尽可能使用不同的词汇。

左侧按 Deepseek 官方的指引将 Temperature 从 0.5 调到 0.6,并将词频惩罚从 0 调到 0.2,右侧是默认参数。

很显然左侧的更像人话,我们可以对比下其中的一段:

增持抗波动实物资产(铜/电网设施)、布局德国 DAX 对冲美股风险、配置中国"中特估"承接全球产能转移需求。

美元对实物资产贬值压力加大,而铜/油/港口基建或成新“硬通货”。另类机会在于被低估的欧洲股票及中国高端制造外需链。

Details

以下是五种适合该研报的标题及摘要方案:

标题一

《特朗普接棒"拜登大循环":双赤字困局下的"大重置"与资产重估》

摘要

拜登政府通过"紧货币+宽财政"复刻"里根繁荣",推动美股美元双高估值。但双赤字恶化正将美国推向临界点——特朗普的"大重置"或将通过制造业回流和债务稀释打破现有体系。报告揭示三大路径:资本结构脱虚向实(道指跑赢纳指)、美元信用重塑(实物资产崛起)、金融市场震荡(警惕基差套利平仓风险),并给出全球资金再平衡下的七条投资主线。

标题二

《美元霸权松动时刻:"大重置"下的全球资产再平衡》

摘要

当美债利息首超军费支出、对冲基金杠杆交易达历史峰值,"大重置"正从口号变为现实。报告指出:特朗普政策组合(减税+关税+金融抑制)将加速美元体系裂变——美股估值承压但道指结构性占优、实物资产开启超级周期、欧亚股市迎资金回流机遇。投资者需警惕债务上限解决后的"三杀"风险,并把握弱美元周期中的新兴市场红利。

标题三

《从"345"到"大重置":解码美国新范式下的七条投资主线》

摘要

拜登时代的 3%通胀/4%利率/5%增长框架正被颠覆。报告发现:特朗普的制造业复兴计划可能使美债利率长期锚定 4%,但通过 YCC 等工具压低实际利率;美元对实物资产贬值趋势明确(黄金/基建/港口估值重构);美股风格切换至价值股(金融/工业占优)。配置建议包括做多欧洲 STOXX50、增持离岸人民币资产、建立中美欧"现金牛"组合。

标题四

《美债风暴预警:"大重置"或触发股债汇三杀》

摘要

当前对冲基金美债基差套利规模已达 2019 年两倍,而隔夜逆回购蓄水池濒临枯竭——债务上限解决后的美债供给冲击或成导火索。报告预警:若 10 年期美债利率波动超 50BP,可能引发 2.3 万亿美元外资持股的连锁抛售。应对策略包括:增持抗波动实物资产(铜/电网设施)、布局德国 DAX 对冲美股风险、配置中国"中特估"承接全球产能转移需求。

标题五

《当"里根循环"遇上"特朗普重置":四十年产业资本回归进行时》

摘要

从金融资本主导(1980-2020)到产业资本复兴,美国正经历百年第三轮财富分配革命。数据显示:制造业 FDI 占比已从 2016 年的 28%升至 2024 年的 47%,但代价是美元环流机制松动——美股外资持仓 70%集中在科技股的风险敞口暴露。报告建议:减持纳指 ETF 转投道琼斯工业指数、增配欧洲隐形冠军企业、把握中国高端装备出海机遇。

每个标题均体现政策周期转折与资产定价逻辑变化的关系,摘要通过数据锚点(如外资持股占比、制造业 FDI 变化)增强说服力,同时将复杂宏观叙事转化为可操作的配置策略(如多道指空纳指),符合专业投资者与普通读者的双重需求。


原中金研报的标题是:

特朗普“大重置”:债务化解、脱虚向实、美元贬值

前言:

无论脱虚向实,还是化解债务,在没有生产率大幅改善的情况下,我们判断其政策路径的交集大概率指向全球资金再平衡、通胀压力、美元贬值、金融抑制。

摘要:

“特朗普有意制造衰退”[1]、“特朗普不顾股市”[2]、“美国经济可能经历排毒期(detox    period)”[3]......迥异于特朗普 1.0 的新闻头条近期不断冲击着本就脆弱的美股市场。叠加特朗普 2.0 难以自洽的多重政策目标,令投资者莫衷一是。 我们提出一个尝试理解特朗普最终目标和政策路径的框架---“大重置”。我们认为特朗普面临二战以来亟需解决的两大根本问题:悬殊的贫富差距;史高的政府债务压力。在该框架中,我们预计特朗普试图通过重置资本结构,即调整产业资本和金融资本的关系,期望实现脱虚向实、再工业化,并最终缩小贫富分化。同时,在没有生产力重大提升的情况下,我们认为特朗普可能试图通过通胀贬值、必要时候金融抑制来重置债务负担,最终化解债务风险。 无论脱虚向实,还是化解债务,在没有生产率大幅改善的情况下,我们判断其政策路径的交集大概率指向全球资金再平衡、通胀压力、美元贬值、金融抑制。脱虚向实,意味着全球化以来美元回流体系面临挑战,金融资本将在美国 vs 非美之间再平衡,这将对以通胀、汇率、利率为核心的价格体系产生深远影响。首先,适度的高通胀如果伴随实体经济和产业资本再崛起,那么通胀可能不再是主要矛盾。其次,美元贬值可能不仅体现在对主要贸易伙伴上,更体现在对一揽子有助于化债和再工业化的实物资产上。最后,在美债利率内生性高企 vs 外生性抑制、美债海外减持 vs 国内增持的动态平衡下,我们预计十年期美债利率或仍维持+4.0%的中枢水平,除非实施 QE 或金融抑制来大幅压低利率曲线。 在今年债务上限解决后,在没有债务重组的情况下,美债供给冲击大概率将导致流动性“抽血”、利率抬升、金融市场波动率放大,恐引发高杠杆和信用投资者平仓风险。当处于史高规模的对冲基金基差套利交易,遇上美国信用债目前估值史高且这两年集中到期高峰,再叠加美联储隔夜逆回购-流动性的蓄水池-已降至史低,恐加剧流动性冲击甚至非银部门系统性被迫降低仓位的风险。我们预计这将倒逼重启 QE,进一步压低美元。 股市上,我们判断自 2012 年以来的“美股例外论”可能终结。欧洲、新兴市场、尤其中国股市有望开启趋势重估。脱虚向实下,美股估值趋势下行,风格转换。看好主要代表产业资本的工业、材料、能源、消费等趋势跑赢主要代表金融资本的大盘成长。

大语言模型的主要参数设置:

  • Max Tokens:指定模型在停止生成之前可以生成的最大令牌(或词)数量;
  • Temperature:控制模型输出的随机性。值越高(越接近 1),输出就越随机,而值越低,输出就越确定;
  • Top-P:指定模型输出的多样性。与 Temperature 类似,但更精确;
  • Top-K:从前 k 个 token 中抽样。有助于加快生成过程,并能提高生成文本的质量;
  • Frequency Penalty:通过惩罚已经频繁使用的单词来减少模型线中重复出现单词的可能性。

大部分大模型产品已内置系统提示词,用户只能输入用户提示词。只有在使用非蒸馏模型的 API 时,注入系统提示词配合模型参数调整能实现个性化需求的效果,例如要定制专门用于行业研究用途的大模型。

基本提示词框架

Elavis Saravia 框架:

  • Instruction说明:即希望模型执行的特定任务。例如,您可能希望模型生成文本、翻译语言或编写不同类型的创造性内容;
  • Context上下文:即希望模型理解的请求所需的背景信息。例如,如果要求模型生成有关特定主题的文本,则需要向模型提供有关该主题的信息;
  • Input Data输入数据:即模型需要处理的数据。例如,如果你要求模型将一个句子从英语翻译成中文,你需要向模型提供英语句子;
  • Output Indicator输出指示器:即向模型发出的关于期望的输出类型或格式的信号。例如,如果要求模型生成文本,则可以指定希望输出为一段文本;

CRISPE 框架:

  • Capacity and role角色:即希望模特扮演的角色。例如,你可能希望模特扮演首席经济学家、产业专家等;
  • Insight洞察:即希望模型理解的请求所需的背景信息和上下文;
  • Statement声明:即希望模型执行的特定任务;
  • Personality个性:即希望模型回答请求的风格或方式;
  • Experiment实验:即对模型提供多个答案的请求,从而通过迭代获得更好的答案;

how-to-prompt2.jpg

AI生图提示词公式:

提示词 = 主体(主体描述)+ 场景(场景描述)+ 风格(定义风格)+ 镜头语言 + 氛围词 + 细节修饰

  • 主体描述:确定主体清晰地描述图像中的主体,包括其特征,动作等。例如,“一个可爱的10岁中国小女孩,穿着红色衣服”。
  • 场景描述:场景描述是对主体所处环境特征细节的描述,可通过形容词或短句列举。
  • 定义风格:定义风格是明确地描述图像所应具有的特定艺术风格、表现手法或视觉特征。例如,“水彩风格”,“漫画风格”常见风格化详见下方提示词词典。
  • 镜头语言:镜头语言包含景别、视角等,常见镜头语言详见下方提示词词典。
  • 氛围词:氛围词是对预期画面氛围的描述,例如“梦幻”、“孤独”、“宏伟”,常见氛围词详见下方提示词词典。 细节修饰:细节修饰是对画面进一步的精细化和优化,以增强图像的细节表现力、丰富度和美感。例如“光源的位置”、“道具搭配”、“环境细节”、“高分辨率”等。

参考来源:通义万象

TIP

如果大模型输入编辑器不支持换行,在上下文结构文本可使用换行符\n转义表示换行,或者用特殊字符- 丨分割。

INFO

案例:有限样本提示 你是一位创新药 Biopharma 产业专家,请对以下公司进行分类,哪家企业主营做哪款创新药,属于哪种药物类型?示例:1.药明生物 \n 抗癌 ADC 大分子蛋白;2.药明康德 \n 化学药 小分子蛋白;3.科济药业\n 异体 CAR-T 靶向 BCMA。问题:百济神州研发、生产、销售哪种类型药物,和其他创业药企业有什么差异化的地方?核心竞争力在哪?要求用表格结构化输出。

Details

Deepseek R1 671B 联网搜索输出

以下是百济神州的药物类型、差异化特征及核心竞争力的结构化分析:

药物类型代表产品适应症领域差异化特征核心竞争力
小分子靶向药泽布替尼(Zanubrutinib)血液肿瘤(如套细胞淋巴瘤、慢性淋巴细胞白血病)首个国产 BTK 抑制剂,全球头对头试验击败强生伊布替尼,美国市场占有率 60%自主全球临床试验管理能力,覆盖欧美主流市场,临床数据国际认可度高。
大分子免疫治疗替雷利珠单抗(Tislelizumab)实体瘤(如食管癌、肺癌)唯一国产 PD-1 抗体完成头对头 III 期试验,海外定价为国内 20 倍,布局差异化适应症。自建全球化商业化团队,直接对接欧美市场,避免依赖 MNC 授权。
PARP 抑制剂帕米帕利(Pamiparib)卵巢癌、前列腺癌等针对 BRCA 突变患者,覆盖中国及亚太市场,适应症扩展潜力大。通过自主研发与外部授权结合,快速填补市场空白。
ADC 药物BGB-C354(靶向 B7H3)晚期实体瘤联合 PD-1 抗体探索协同效应,布局新兴靶点(B7H3),覆盖肺癌、乳腺癌等高发癌种。多靶点矩阵(如 B7H3、EGFR、KRAS 等),技术平台覆盖双抗、蛋白降解剂等前沿领域。

与其他创新药企业的差异化及核心竞争力总结

  1. 全球化能力

    • 全产业链自主化:从研发、临床到商业化均自主运营,覆盖全球 40+国家,临床试验数据直接对标国际标准。
    • 海外市场收入占比高:泽布替尼 2024 年海外收入占比超 70%,打破国产药“内卷”局限。
  2. 研发模式创新

    • “去 CRO 化”研发:自主管理全球多中心试验,降低对外部 CRO 依赖,提升效率(如泽布替尼头对头试验仅用 3 年完成)。
    • 高研发投入:2024 年研发费用超 200 亿元,聚焦实体瘤、血液瘤领域前沿靶点(如 TIGIT、BCL-2、HPK1 等)。
  3. 商业化策略

    • 多产品协同:PD-1 与 ADC 联合疗法探索,提升单药市场天花板(如 BGB-C354 联合替雷利珠单抗)。
    • 政策红利捕捉:率先受益于国内“创新药目录”及 FDA 加速审批通道,缩短产品上市周期。
  4. 风险与挑战

    • 盈利压力:2024 年归母净利润仍亏损 49.78 亿元,依赖融资支撑高研发投入。
    • 产品集中风险:泽布替尼占营收近 70%,需加速第二梯队产品(如 PARP 抑制剂、ADC)商业化。

总结

百济神州的核心竞争力在于其“全球化+全产业链自主化”模式,通过高研发投入和差异化临床设计,在 BTK 抑制剂、PD-1 抗体等红海赛道实现突围。相较于恒瑞医药等传统药企,其更注重国际市场的直接竞争;相较于新兴 Biotech,其规模化能力和管线深度更具优势。未来需关注 ADC 管线进展及盈利能力的实质性改善。

Deepseek 的正确打开方式

Deepseek 在R1 模型的开源仓库和开源社区中说明要按以下配置以实现预期性能:

  1. 优化采样参数:Temperature 参数(用于控制模型输出的随机性或多样性),建议设置范围 0.5-0.7,推荐 0.6,这样可以避免无限重复或者不连贯得输出;
  2. 不要使用系统提示词:所有指令都建议放在用户 Prompt 提示语中,也就是不要使用任何系统层的任务指令;
  3. 数学任务:建议在提示中包含一个类似这样的指令:“请逐步推理,并将最终答案放在\boxed{}.” \boxed{}是 LaTeX 中的盒子,给数学公式加方框,结构化数学公式,有助于正确前端渲染,建议使用 LaTeX 数学符号公式

INFO

案例:引导大模型优化数学公式输出,使得能有效渲染前端

请从随机微分方程推导出伊藤漂移扩散过程,股票年收益率是\mu,股票的波动率是\sigma,解释为什么每年的连续复利期望收益率是\mu - 0.5 \sigma ^2?最终是如何得到 Black-Scholes 微分方程和风险中性定价方程?请逐步推理,并将最终答案放在\boxed{},要求在数学公式前后加一个或两个$(符合 KaTeX 的格式规范)。

Details

1. 随机微分方程与伊藤漂移扩散过程

假设股票价格St遵循几何布朗运动(Geometric Brownian Motion, GBM),其随机微分方程为:

dSt=μStdt+σStdWt,

其中: -μ是年化收益率(也称为漂移项), -σ是年化波动率(也称为扩散系数), -Wt是标准布朗运动。

这是一个伊藤漂移扩散过程,表示股票价格的对数变化是线性漂移加上一个随机扰动。


2. 股票连续复利收益率的期望值

为了理解为什么连续复利收益率的期望值是μ0.5σ2,我们需要对方程进行变换。定义对数价格Xt=ln(St),则根据伊藤引理(Ito's Lemma),有:

dXt=dStSt12(σStSt)2dt.

dSt=μStdt+σStdWt代入上式,得到:

dXt=(μ12σ2)dt+σdWt.

这表明对数价格Xt的变化由两部分组成:

  • 漂移项:μ12σ2
  • 扩散项:σdWt

因此,股票价格的连续复利收益率的期望值为:

μ0.5σ2.

这是因为对数收益率的期望值受到扩散项平方的影响,而这种影响通过12σ2表现出来。


3. Black-Scholes 微分方程的推导

我们考虑一个金融衍生品的价格V(St,t),它依赖于股票价格St和时间t。根据伊藤引理,V(St,t)的动态为:

dV=(Vt+μSVS+12σ2S22VS2)dt+σSVSdWt.

为了消除随机项dWt,我们构造一个无风险组合。假设该组合包含Δ单位的股票和B单位的无风险资产,则组合价值为:

Π=VΔS.

选择Δ=VS,可以消除组合中的随机项dWt。此时,组合的价值变化为:

dΠ=(Vt+12σ2S22VS2)dt.

由于组合是无风险的,其收益率应等于无风险利率r,即:

dΠ=rΠdt=r(VΔS)dt.

Δ=VS代入,并整理后得到 Black-Scholes 微分方程:

Vt+12σ2S22VS2+rSVSrV=0.

最终形式为:

Vt+12σ2S22VS2+rSVSrV=0.

4. 风险中性定价方程

在风险中性世界中,所有资产的预期收益率都等于无风险利率r。这意味着股票价格的动态变为:

dSt=rStdt+σStdWt.

在这种情况下,衍生品的价格V(St,t)满足的风险中性定价方程仍然是 Black-Scholes 方程:

Vt+12σ2S22VS2+rSVSrV=0.

这表明,在风险中性假设下,Black-Scholes 方程可以直接用于计算衍生品的价格。


总结

  1. 连续复利收益率的期望值为μ0.5σ2
  2. Black-Scholes 微分方程为:
Vt+12σ2S22VS2+rSVSrV=0.
  1. 在风险中性假设下,衍生品价格满足相同的方程。
  1. 再次尝试:在评估模型性能时,建议生成多个解决方案,然后使用最频繁的结果;
  2. 设定明确的要求:当您的请求有特定的限制或标准时,请明确说明它们(例如 “每行说话时间不应超过 5 秒……”)。无论是预算限制、时间限制还是特定格式,都应清楚地概述这些参数,以指导模型的响应;
  3. 无思维链提示: 由于这些模型总是在回答问题之前进行推理,因此没有必要告诉它们 “逐步推理……”;
  4. 强制 <think>: 在极少数情况下,DeepSeek-R1 会倾向于绕过思考模式,这可能会对模型的性能产生不利影响。在这种情况下,响应不会以<think> 标签开头。如果您看到此问题,请尝试告诉模型以 <think> 标签开头;
  5. 构建你的提示: 使用清晰的标记(如XML 标签、Markdown 格式或带标签的部分)来分隔提示的不同部分。这种组织有助于确保模型正确解释和处理请求的每个组成部分;

TIP

  • Markdown(层级结构文档),Markdown 是一种内容结构内的脚本语言,其内容为层级关系,最多有六级标题,六级之后为正文。通常用 AI 生成 PPT 和思维导图,都采用 Markdown 的文件格式。Markdown 教程
  • Mermaid(标记语言来表示并绘制流程、结构图),大模型是无法自己作图的,但是能生成作图的脚本,逻辑图的脚本就是 Mermaid 格式有了结构图的脚本,就可以在能解析 Mermaid 文件格式的网址(如 draw.io)来生成结构图。如果我们不满足结构图,还可以根据文件内容做成网页(HTML)。Mermaid 允许你使用文本和代码创建图表和可视化。
  • HTML(网页超文本标记语言),使用 HTML 元素的标签(Tag)来注明我们的内容,MDN Web HTML
  • Python(一种更为广泛的格式),可以用来完成数据分析、编程、游戏、网页等任务,未来将更常用于 AI 智能体(AI Agent);
  1. 清楚地描述输出: 描绘出你期望结果的清晰图景。描述使响应完全符合您需要的具体特征或质量,从而让模型能够努力满足这些标准;
  2. 设定明确的要求: 当您的请求有特定的限制或标准时,请明确说明它们(例如 “每行演讲说话时间不应超过 5 秒……”)。无论是预算限制、时间限制还是特定格式,都应清楚地概述这些参数,以指导模型的响应;

Deepseek R1 模型是从其他用原始数据训练模型使用模型蒸馏的方法训练出来,学生模型追求轻量化,优化单轮问答任务,并过滤复杂交互样本,学生模型在没有系统提示词输入的情况下训练出来,自然无法很好地理解系统层提示词,相当于增加了噪音。不用系统提示词也避免了指令冲突和上下文干扰的问题。

OpenAI 的建议

写下清晰的说明

为了获得高度相关的响应,请确保请求提供所有重要细节或背景信息。否则,您将让模型来猜测您的意思。

不明确的指令明确的指令
如何在 Excel 中添加数字?如何在 Excel 中将一行美元金额相加?我想自动对整张表的行执行此操作,所有总计最终显示在右侧名为“总计”的列中。
谁是总统?2021 年墨西哥总统是谁?选举频率是多少?
编写代码计算斐波那契数列。编写一个 TypeScript 函数来高效计算斐波那契数列。对代码进行大量注释,解释每个部分的作用以及为什么这样编写。
总结会议记录。用一段话总结会议记录。然后写下演讲者及其要点的简要列表。最后,列出演讲者建议的后续步骤或行动项目(如果有)。

通过在提示中明确指定模型的角色,可以使其生成更符合特定视角或专业领域的响应。

策略:使用分隔符清楚地指示输入的不同部分

三重引号"""、XML 标签、章节标题等分隔符可以帮助划分需要不同处理的文本部分。

用俳句总结用三重引号分隔的文本。

INFO

"""在此处插入文本"""

HTML
<article>在此处插入第一篇文章</article>
<article>在此处插入第二篇文章</article>
<goal>我的目标</goal>
<examples>
  <example>示例1</example>
  <example>示例2</example>
  <example>示例3</example>
</examples>
<think>xxx问题</think>

觉得标签和分隔符太麻烦?那不妨尝试下将事物本身结构化,AI 也能理解数个分散的句子:

INFO

摘要:我方某项目涉及 IPO 股权回购对赌,若在约定时间内 IPO 失败,对手方签署承诺函以某价格完成回购

情景:回购对赌未完成,公司业绩持续下滑,按预期违约进行司法救济

思考:发起诉讼胜率如何?法院如何判定滥用回购协议恶意造成挤兑的情况?有案例可以参考吗?

角色:律师

Details

针对您提及的 IPO 股权回购对赌协议纠纷问题,结合司法实践及搜索结果中的相关案例,分析如下:


一、诉讼胜率的关键因素

  1. 对赌协议的合法性与履行条件
    法院通常认可对赌协议的效力,但需满足以下条件:

    • 主体适格:若回购义务主体为创始人或股东个人(而非目标公司),法院倾向于支持回购请求(如华金证券案中,法院判决实控人履行回购义务)。
    • 条款不违反公序良俗或监管规定:若协议涉及二级市场股价操纵(如挂钩市值的回购条款)或未按监管要求清理(如 IPO 申报前未披露),可能被认定无效。
    • 程序合规性:若目标公司需履行减资程序但未完成,法院可能驳回对目标公司的回购请求。
  2. 业绩下滑与违约责任的关联性

    • 若业绩下滑系因不可抗力(如疫情、行业波动),法院可能酌情调整回购金额或期限(如得润电子案中,公司主张环境因素影响 IPO 进程,但最终仍需承担部分责任)。
    • 若对手方存在恶意行为(如隐瞒关键信息、操纵业绩),可主张其构成根本违约,要求加速回购。

二、法院对“滥用回购协议”的裁判倾向

  1. 认定“滥用”的标准

    • 条款显失公平:如回购利率过高(如年化 8%以上)、期限过短(如 3 年内上市),可能被认定为“变相高利贷”,法院可能调整利率或驳回部分请求。
    • 损害公司及债权人利益:若回购导致公司资本抵债或损害中小股东权益,法院可能以违反《公司法》资本维持原则为由限制履行。
  2. 司法案例参考

    • 案例 1(无效条款):上海二中院认定与二级市场股价挂钩的回购条款无效,因其破坏金融秩序(江苏硕世案)。
    • 案例 2(支持回购):浦东法院判决华金证券胜诉,因其协议条款合法且无规避监管行为。
    • 案例 3(部分支持):得润电子因环境因素未履约,法院支持回购但调整利息计算方式。

三、诉讼策略建议

  1. 证据准备

    • 收集对手方恶意行为证据(如虚假陈述、操纵业绩)。
    • 证明业绩下滑与不可抗力的关联性(如行业数据、第三方报告)。
  2. 抗辩方向

    • 主张条款无效:若协议存在挂钩市值、未披露等情形,可援引江苏硕世案。
    • 请求调整违约金:依据《民法典》第 585 条,主张违约金过高(如超过实际损失的 30%)。
  3. 替代解决方案

    • 协商引入新投资者承接股权(如得润电子尝试的方案)。
    • 申请个人破产(若涉及创始人连带责任,需关注未来立法进展)。

四、风险提示

  1. 执行风险:即使胜诉,若对手方资不抵债(如同禹药包实控人被限高),可能面临执行困难。
  2. 监管风险:未清理的对赌协议可能导致 IPO 审核失败(如顶立科技因对赌条款未完全解除被北交所关注)。

五、总结

诉讼胜率取决于协议条款的合法性、履约证据的充分性及对手方行为性质。建议优先通过协商调整条款(如延长对赌期限、降低利率),若诉讼不可避免,需重点论证协议公平性及对手方过错。参考案例时,应关注条款设计是否合规及司法对金融秩序的维护倾向。

对于这类简单的任务,使用分隔符可能不会对输出质量产生影响。但是,任务越复杂,消除任务细节的歧义就越重要,不要让模型努力理解你对它们的要求。

策略:指定完成任务所需的步骤

将复杂的任务拆分成更小的部分,可以使模型更有效地处理每个部分,从而提高整体任务的完成质量。

策略:指定所需的输出长度

您可以要求模型生成具有给定目标长度的输出。目标输出长度可以根据单词、句子、段落、要点等的数量来指定。但请注意,指示模型生成特定数量的单词并不能实现高精度,但模型可以更可靠地生成具有特定数量的段落或要点的输出。

用三重引号分隔的文本总结约 50 个字。"""在此处插入文本"""

策略:指示模型用参考文本中的引文来回答

如果输入已补充相关知识,则可以直接要求模型通过引用所提供文档中的段落为其答案添加引文。请注意,然后可以通过所提供文档中的字符串匹配以编程方式验证输出中的引文。

系统

您将获得一份由三重引号分隔的文档和一个问题。您的任务是仅使用所提供的文档回答问题,并引用用于回答问题的文档段落。如果文档不包含回答此问题所需的信息,则只需写:“信息不足”。如果提供了问题的答案,则必须用引文注释。使用以下格式引用相关段落({“citation”:…})。

用户

"""<在此处插入文档>""" 问题:<在此处插入问题>

策略:将复杂任务拆分为更简单的子任务

将复杂的任务拆分成更小的部分,可以使模型更有效地处理每个部分,从而提高整体任务的完成质量。

如何选择模型

对于您的用例来说什么是最重要的?

  • 速度和成本 →GPT 模型速度更快,而且成本更低
  • 执行明确定义的任务 →GPT 模型可以很好地处理明确定义的任务
  • 准确性和可靠性 → o 系列模型是可靠的决策者
  • 解决复杂问题 → o 系列模型解决模糊性和复杂性
  • 如果速度和成本是完成任务时最重要的因素,并且您的用例由简单、定义明确的任务组成,那么我们的 GPT 模型最适合您。但是,如果准确性和可靠性是最重要的因素,并且您要解决的问题非常复杂且包含多个步骤,那么我们的 o 系列模型可能适合您。

大多数 AI 工作流程都会结合使用这两种模型———o 系列用于代理规划和决策,GPT 系列用于任务执行。

什么时候选择推理模型

  • 处理模糊任务:推理模型尤其擅长利用有限的信息或分散的信息,通过简单的提示,理解用户的意图并处理指令中的任何空白。事实上,推理模型通常会在做出无根据的猜测或试图填补信息空白之前提出澄清问题。
  • 大海捞针:当你传递大量非结构化信息时,推理模型可以很好地理解并提取最相关的信息来回答问题。
  • 在大型数据集中寻找关系和细微差别:我们发现推理模型特别擅长推理包含数百页密集、非结构化信息的复杂文档,例如法律合同、财务报表和保险索赔。这些模型特别擅长在文档之间进行比较,并根据数据中不言而喻的事实做出决策。推理模型还擅长推理细微的政策和规则,并将其应用于手头的任务以得出合理的结论;
  • 多步骤代理规划:推理模型对于代理规划和战略制定至关重要。我们已经看到,当推理模型被用作“规划者”时,它会为问题提供详细的多步骤解决方案,然后根据高智能或低延迟哪个更重要,为每个步骤选择和分配正确的 GPT 模型(“执行者”),从而获得成功;
  • 视觉推理:截至目前,o1 是唯一支持视觉功能的推理模型。与 GPT-4o 不同的是,o1 甚至可以理解最具挑战性的视觉内容,例如结构模糊的图表和表格或图像质量较差的照片;
  • 审查、调试和改进代码质量:推理模型在审查和改进大量代码方面特别有效,由于模型的延迟较高,因此通常在后台运行代码审查。虽然 GPT-4o 和 GPT-4o mini 可能更适合以较低的延迟编写代码,但我们也看到 o3-mini 在对延迟敏感度稍低的用例中的代码生成方面出现激增。

如何有效提示推理模型

  • 开发人员消息是新的系统消息:从 开始,推理模型支持开发人员消息而不是系统消息,以与模型规范o1-2024-12-17中描述的命令链行为保持一致。
  • 保持提示简单直接:模型擅长理解和响应简短、清晰的指示。
  • 避免思路链提示:由于这些模型在内部进行推理,因此不需要提示它们“逐步思考”或“解释你的推理”。
  • 使用分隔符来提高清晰度:使用 markdown、XML 标签和章节标题等分隔符来清楚地指示输入的不同部分,帮助模型适当地解释不同的部分。
  • 首先尝试零样本,然后根据需要尝试少量样本:推理模型通常不需要少量样本示例即可产生良好的结果,因此请先尝试编写没有示例的提示。如果您对期望输出有更复杂的要求,则在提示中包含一些输入和期望输出的示例可能会有所帮助。只需确保示例与您的提示说明非常一致,因为两者之间的差异可能会产生不良结果。
  • 提供具体指导:如果您明确想要限制模型的响应(例如“提出预算低于 500 美元的解决方案”),请在提示中明确概述这些限制。
  • 明确你的最终目标:在你的说明中,尝试给出成功响应的非常具体的参数,并鼓励模型不断推理和迭代,直到符合你的成功标准。
  • Markdown 格式:从 开始o1-2024-12-17,API 中的推理模型将避免生成带有 markdown 格式的响应。若要向模型发出信号,告知您何时希望在响应中使用 markdown 格式,请在Formatting re-enabled开发人员消息的第一行包含字符串。

参考来源:OpenAI

思维链提示

思维链提示(Chain-of-Thought,CoT)通过模拟人类解决复杂问题时的思考过程,引导大语言模型在生成答案的过程中引入一系列的中间推理步骤。这种方法不仅能够显著提升模型在推理任务上的表现,而且还能够揭示模型在处理复杂问题时的内部逻辑和推理路径。

CoT 方法的核心是构造合适的 Prompt 以触发大语言模型一步一步生成推理路径,并生成最终答案。早期方法在构造 Prompt 时,加入少量包含推理过程的样本示例(Few-Shot Demonstrations),来引导模型一步一步生成答案。在这些示例中,研究者精心编写在相关问题上的推理过程,供模型模仿、学习。这种方法使得模型能够从这些示例中学习如何生成推理步骤,一步步输出答案。

在 CoT 核心思想的指引下,衍生出了一系列的扩展的方法。这些扩展的方法按照其推理方式的不同,可以归纳为三种模式:按部就班、三思后行和集思广益。

  • 按部就班。在按部就班模式中,模型一步接着一步地进行推理,推理路径形成了一条逻辑连贯的链条。在这种模式下,模型像是在遵循一条预设的逻辑路径,“按部就班”的一步步向前。这种模式以 CoT、零样本提示(Zero-Shot CoT)、自动提示(Auto-CoT) 等方法为代表。Zero-Shot 就在提示词中添加“Let’s think step by step/让我们一步一步思考”引导模型自行生成推理链,减少了对人工示例的依赖,多个推理任务上展现出了与原始少样本 CoT 相媲美甚至更优的性能;Auto-CoT 需要用户构造一定样本的问题库,提供相似或同类型问题的答案,大模型会利用聚类技术从问题库中筛选出与用户提问位于一个簇中的问题,再进行 Zero-Shot 的过程;
  • 三思后行。在三思后行模式中,模型每一步都停下来估当前的情况,然后从多个推理方向中选择出下一步的行进方向。在这种模式下,模型像是在探索一片未知的森林,模型在每一步都会停下来评估周围的环境,“三思后行”以找出最佳推理路径。这种模式以思维树 ToT、思维图 GoT 等方法为代表。ToT 将推理过程构造为一棵思维树,先是拆解,将复杂问题拆分成多个简单子问题,每个子问题的解答过程对应一个思维过程。思维过程拆解的形式和粒度依任务类别而定,例如在数学推理任务上以一行等式作为一个思维过程,在创意写作任务上以内容提纲作为思维过程;其次是衍生,模型需要根据当前子问题生成可能的下一步推理方向。衍生有两种模式:样本启发和命令提示。样本启发以多个独立的示例作为上下文,增大衍生空间,适合于创意写作等思维空间宽泛的任务;命令提示在 Prompt 中指明规则和要求,限制衍生空间,适用于 24 点游戏等思维空间受限的任务;然后是评估,利用模型评估推理节点合理性。根据任务是否便于量化评分,选择投票或打分模式。投票模式中,模型在多节点中选择,依据票数决定保留哪些节点;打分模式中,模型对节点进行评分,依据评分结果决定节点的保留。最后是搜索,从一个或多个当前状态出发,搜索通往问题解决方案的路径。依据任务特点选择不同搜索算法。可以使用深度优先搜索、广度优先搜索等经典搜索算法,也可以使用蒙特卡洛树搜索等启发式搜索算法。

INFO

思维树(ToT)提示词案例

假设六位不同行业的首席经济学家来回答这个问题。 所有专家都写下他们思考这个问题的第一个步骤,然后与大家分享。 然后,所有专家都写下他们思考的下一个步骤并分享。 以此类推,直到所有专家写完他们思考的所有步骤。 只要大家发现有专家的步骤出错了,就让这位专家离开。 请问根据 2024 年全年的经济数据,分析国际地缘政治摩擦和国内产业结构,判断 2025 年中国经济的宏观大环境,哪些行业能在中港股市中得到重配(主要体现在估值上涨)。

Details

以下是根据 2024 年经济数据、国际地缘政治摩擦与国内产业结构调整背景,模拟六位首席经济学家分步骤讨论 2025 年中国经济宏观环境及中港股市重配行业的分析过程:


专家讨论步骤模拟

第一步:确定宏观经济核心矛盾

  1. 宏观政策专家

    • 步骤:分析 2024 年 GDP 增速 5%的实现路径,发现消费贡献下降(2024 年消费对 GDP 拉动从 4.3%降至 2.2%),净出口意外高增长(贸易顺差 7.06 万亿元)是主因。
    • 结论:2025 年外需可能因美国关税升级(特朗普政府政策)和全球需求放缓而收缩,需依靠内需填补缺口。
  2. 消费行业专家

    • 步骤:观察 2024 年社会消费品零售总额同比增长 3.5%,但 11 月数据下滑,政策刺激(如以旧换新)对家电、汽车短期有效,但持续性存疑。
    • 结论:内需修复需更多财政直接补贴和政策创新(如消费券、收入分配改革)。
  3. 科技行业专家

    • 步骤:评估 2024 年高技术制造业增加值增长 8.9%,AI、储能、半导体等领域增速超 20%,显示新质生产力加速形成。
    • 结论:科技行业具备长期增长潜力,但需警惕美国技术封锁风险。
  4. 房地产专家

    • 步骤:2024 年房地产开发投资下降 10.6%,但政策转向“稳定楼市”后,2025 年跌幅可能收窄至-5%。
    • 错误:未考虑居民购房意愿与房企资金链压力,被其他专家指出需修正。
  5. 国际贸易专家

    • 步骤:测算中美贸易摩擦对中国出口的潜在影响(出口或减少 4.2%~9.7%),并关注欧盟加征关税对电动汽车的影响。
    • 结论:出口依赖型行业(如低端制造业)风险上升,需转向内需或高附加值领域。
  6. 金融策略专家

    • 步骤:分析 2024 年 A 股上涨 14%,但盈利增长疲软(非金融板块连续四个季度下滑),估值修复依赖政策预期。
    • 结论:2025 年需盈利与估值双驱动,关注政策支持行业。

淘汰:房地产专家因忽略房企资金链压力,步骤不完整,退出讨论。


第二步:政策与市场信心关联性验证

  1. 宏观政策专家

    • 步骤:评估 2025 年财政赤字率或达 4%,专项债+特别国债规模或超 11 万亿元,重点投向“两新”(新基建、新消费)领域。
    • 结论:基建、科技、消费补贴受益,但地方政府债务压力可能制约效果。
  2. 消费行业专家

    • 步骤:验证居民超额储蓄(约 6 万亿元)释放可能性,需依赖股市/楼市企稳修复财富效应。
    • 结论:若政策刺激到位,消费板块(食品饮料、汽车)估值弹性较大。
  3. 科技行业专家

    • 步骤:分析全球资本对中国 AI、新能源的配置需求(如创业板 50 指数 2025 年涨幅超 16%)。
    • 结论:科技行业外资流入可能对冲外部风险,但需关注美国限制措施。
  4. 国际贸易专家

    • 步骤:模拟越南、马来西亚等新兴贸易枢纽对中国的替代效应,发现短期难以撼动中国供应链优势。
    • 结论:出口结构升级(如机电产品占比 59.4%)可部分抵消外需下滑。
  5. 金融策略专家

    • 步骤:测算 A 股股权风险溢价(ERP)仍高于历史均值,显示估值修复空间。
    • 结论:流动性宽松(降准降息)+盈利复苏(预计沪深 300 盈利增长 6%)支撑股市。

淘汰:无。


第三步:行业重配逻辑整合

  1. 宏观政策专家

    • 步骤:结合财政发力方向(基建、科技、消费),筛选受益行业:
      • 绿色基建(充电桩、储能)
      • 科技自主可控(半导体、AI 硬件)
      • 消费补贴(新能源汽车、家电)。
  2. 消费行业专家

    • 步骤:识别结构性机会:
      • 银发经济(医疗保健、养老服务)
      • 情绪消费(文旅、国潮品牌)
      • 必需品升级(高端食品饮料)。
  3. 科技行业专家

    • 步骤:聚焦政策支持与全球趋势:
      • AI 应用(医疗、自动驾驶)
      • 新能源技术(储能、光伏)
      • 高端制造(航空航天、机器人)。
  4. 国际贸易专家

    • 步骤:规避外需风险,优选内需+技术壁垒行业:
      • 进口替代(医疗器械、工业软件)
      • 一带一路关联(基建、电力设备)。
  5. 金融策略专家

    • 步骤:综合机构配置偏好(调查显示 69.91%看好半导体、86.73%看好 AI),叠加流动性宽松,建议:
      • 成长股(科技、新能源)
      • 红利股(调整后的高股息板块)。

淘汰:无。


最终结论:2025 年中港股市重配行业

  1. 科技与高端制造

    • 细分领域:半导体、AI 硬件、储能、机器人。
    • 逻辑:政策支持(财政投入+国产替代)+全球技术周期(AI、新能源)。
  2. 消费升级与内需驱动

    • 细分领域:新能源汽车、智能家电、食品饮料、银发经济。
    • 逻辑:以旧换新政策延续+超额储蓄释放+人口结构变化。
  3. 绿色经济与基建

    • 细分领域:充电桩、光伏、特高压。
    • 逻辑:“双碳”目标+超长期特别国债资金支持。
  4. 防御性板块

    • 细分领域:保险、高股息公用事业。
    • 逻辑:市场波动中避险需求+利率下行提升分红吸引力。
  5. 政策修复行业

    • 细分领域:房地产(头部国企)、银行。
    • 逻辑:政策托底(债务置换+需求端放松)+估值修复。

风险提示

  • 外部风险:美国关税升级、地缘冲突(如台海、中东)。
  • 内部风险:消费复苏不及预期、房地产债务连锁反应。
  • 市场风险:盈利复苏滞后于估值修复,导致回调压力。

来自普林斯顿大学和 Google DeepMind 实验室的研究人员发表了论文:“Tree of Thoughts: Deliberate Problem Solving with Large Language Models”。本论文介绍了一种名为"思维树"的框架,旨在提升语言模型(Language Models,LMs)在问题解决和决策制定方面的能力。传统的语言模型在规划和决策过程中存在局限性,而"思维树"通过同时考虑多个潜在的可行计划,并利用价值反馈机制进行决策,扩展了现有的规划方法。此外,该方法还引入了自我反思机制,使语言模型能够评估自身生成的候选项的可行性。与其他相关工作相比,"思维树"方法更加灵活,可以处理具有挑战性的任务,如创意写作,并提供了更高水平的问题解决能力。

ToT

  • 集思广益。在集思广益模式中,模型同时生成多条推理路径并得到多个结果, 然后整合这些结果,得到一个更为全面和准确的答案。在这种模式下,模型像是在召开一场智者的会议,每个智者都带来了自己的见解,最终通过讨论和整合,“集思广益”得出一个更优的结论。这一类模式以自我一致性(Self-Consistency)等方法为代表。Self-Consistency 的实现过程可以分为三个步骤:
  1. 思维链。在随机采样策略下,使用 CoT 或 Zero-Shot CoT 的方式来引导大语言模型针对待解决问题生成一组多样化的推理路径;
  2. 多数投票、置信度加权。针对大语言模型生成的每个推理内容,收集其最终的答案,并统计每个答案在所有推理路径中出现的频率,最终选择出现频率最高的答案作为最终的、最一致的答案,这可能更常见于 AI 智能体; Self Consistency
  3. 人工或规则过滤。引导大模型进行自我反思找到矛盾并解决,触发顿悟时刻(Aha Moment);
  4. 解码参数调整 :如提高温度(temperature)参数以增加随机性,或使用集束搜索(beam search)探索不同路径;
  5. 分而治之(DSP) :将复杂任务拆分为子任务,分别生成答案后再整合。

Anthropic 链式思考(分而治之)

  1. 确定子任务:将您的任务分解为不同的、连续的步骤;
  2. 使用 XML 结构实现清晰的交接:使用 XML 标签在提示之间传递输出;
  3. 有一个单一任务目标:每个子任务都应该有一个单一、明确的目标;
  4. 迭代:根据大模型的表现细化子任务。

工作流程示例:

  1. 多步骤分析:参见下面的法律和商业示例;
  2. 内容创作流程:研究 → 大纲 → 草稿 → 编辑 → 格式;
  3. 数据处理:提取 → 转换 → 分析 → 可视化;
  4. 决策:收集信息 → 列出选项 → 分析每一个 → 推荐;
  5. 验证循环:生成内容 → 审核 → 完善 → 重新审核。

不同CoT的差异

实践案例

案例 1:读研报汇总观点

INFO

你是一位研究特定行业的金融分析师,你将收到一份或数份研报,要求总结研报内容并分析其核心观点和投资逻辑,最终提取其中的研报观点,输出结构化的综述(按序号排序,大概在 3-4 个自然段,不要过度碎片化,数字控制在 2000 字内),需要你一步一步思考,输出文本需简洁但能说清客观事实和投资逻辑,要求说人话。 (上传可读取文字的 PDF 文件)

Details

结构化综述:寒武纪(688256)研报核心观点与投资逻辑


1. 行业趋势与市场机会:AI 算力需求爆发,寒武纪占据先发优势

研报指出,全球 AI 算力需求呈现指数级增长,主要驱动力包括大模型训练与推理、边缘智能设备渗透率提升以及“东数西算”等政策支持。国内 AI 芯片市场规模预计 2025 年将突破千亿元,寒武纪作为国内 AI 芯片领域龙头,凭借“云端+边缘端”全场景产品矩阵,已形成技术壁垒。其思元系列芯片在能效比、算力密度等指标上达到国际先进水平,尤其在自然语言处理、图像识别等场景中表现突出。研报强调,寒武纪深度绑定头部客户(如互联网大厂、云计算厂商),且与华为、百度等企业合作推进大模型训练,进一步巩固市场地位。


2. 核心竞争力与技术护城河:自研架构+生态布局强化长期价值

研报认为,寒武纪的核心竞争力体现在三方面:

  • 技术自主性:公司掌握核心 IP(如 DianNaoU 架构),摆脱对海外技术依赖,符合国产替代趋势;
  • 产品迭代速度:2023 年推出思元 590 芯片,算力较上一代提升 4 倍,适配大模型训练需求;
  • 生态闭环能力:通过软硬件协同(如芯片+基础系统软件平台)降低客户开发成本,形成“芯片+工具链+算法”全栈解决方案,增强客户粘性。
    研报特别提到,寒武纪在边缘计算领域的布局(如车载芯片)有望打开新市场,其低功耗、高集成度的芯片已应用于智能驾驶、安防等领域,未来增长空间显著。

3. 财务与增长潜力:短期承压但长期逻辑清晰

研报分析,寒武纪近年收入保持高增速(2022 年营收 17.6 亿元,同比增长 36%),但受研发高投入(2022 年研发费用占比超 60%)及市场竞争影响,净利润仍处亏损状态。然而,其战略布局已显成效:

  • 收入结构优化:云端芯片收入占比提升,高毛利产品(如训练芯片)逐渐放量;
  • 客户多元化:政府、互联网、金融等多行业订单增长,降低单一领域风险;
  • 政策红利释放:国产 AI 芯片在信创、智慧城市等领域的渗透率提升,叠加“十四五”人工智能规划支持,公司有望获得持续订单。
    研报预测,若大模型商业化加速,寒武纪 2025 年营收或突破 50 亿元,净利润有望转正,估值中枢上移。

4. 风险与挑战:技术迭代与市场竞争需持续关注

研报提示潜在风险:

  • 技术替代风险:GPU 厂商(如英伟达)在通用 AI 芯片领域仍占主导,寒武纪需持续突破差异化场景;
  • 供应链稳定性:先进制程芯片代工依赖台积电等厂商,地缘政治或影响产能;
  • 商业化落地节奏:大模型市场需求波动、客户采购周期延长可能拖累短期业绩。
    尽管如此,研报认为寒武纪在国产替代与 AI 算力建设的双重逻辑下具备长期价值,建议关注其在自动驾驶、边缘 AI 等新兴领域的突破进展。

总结

寒武纪的核心投资逻辑在于:AI 算力需求爆发叠加国产替代趋势下,公司凭借技术领先性和生态布局占据战略卡位,短期业绩承压但长期成长性明确。若未来大模型训练需求持续释放、边缘计算场景落地加速,其估值修复空间较大。投资者需平衡技术迭代风险与政策红利,关注研发投入转化效率及客户订单落地情况。

案例 2:善用大模型的搜索功能做事件影响评估

HTML
你是一位生物CXO行业的金融分析师,以下是一段财经快报,请结合百济神州目前的烧钱研发进程,评估该研发成果和临床试验许可对CXO行业的重要性,以及对百济神州2025Q1业绩的潜在影响?
<article>
  <title>百济神州ADC癌症新药联合疗法在中国获批临床</title>
  <p>
    2025年3月4日,中国国家药监局药品审评中心(CDE)官网最新公示,百济神州申报的1类新药注射用BGB-C354获得一项新的临床试验默示许可,拟联合替雷利珠单抗治疗晚期实体瘤患者。公开资料显示,BGB-C354是一款靶向B7H3的抗体偶联药物(ADC),是百济神州在实体瘤领域布局的一款新分子实体。该产品此前于2024年9月首次在中国获批IND,此次获批的这项临床研究,是探索这款ADC联合抗PD-1单抗替雷利珠单抗治疗实体瘤的潜力。
  </p>
</article>
Details

Deepseek R1 671B 联网搜索

评估百济神州 ADC 新药临床试验对 CXO 行业的重要性及对公司 2025Q1 业绩的潜在影响

一、对 CXO 行业的重要性

  1. 加速 ADC 领域研发需求,推动 CXO 订单增长 百济神州的 BGB-C354 是一款靶向 B7H3 的抗体偶联药物(ADC),其联合抗 PD-1 单抗替雷利珠单抗的临床试验获批,标志着公司在实体瘤领域的进一步突破。ADC 药物的研发涉及复杂的抗体设计、毒素连接及生产工艺,对 CXO(医药外包服务)企业的技术能力和产能提出更高要求。随着全球 ADC 研发竞争加剧(如第一三共、葛兰素史克等企业已进入 III 期临床),百济的快速推进将带动 CXO 在临床前研究、CMC(化学、制造与控制)、临床试验管理等环节的需求增长。

  2. 强化中国 CXO 在全球创新药产业链中的地位 百济神州在中国、美国、澳大利亚同步开展 BGB-C354 的 I 期临床试验,其全球化布局需要依赖 CXO 企业的跨国协调能力,尤其是临床数据管理和多中心试验执行。中国 CXO 企业凭借成本优势和逐渐提升的技术能力,有望在此类项目中分得更大份额。

  3. 技术协同与长期合作潜力 百济在实体瘤领域布局了多款 ADC、双抗及新型免疫疗法,形成“多靶点产品矩阵”。CXO 企业若能深度参与其早期研发,可能通过技术协同建立长期合作关系,尤其是在 ADC 的毒素优化、联合疗法设计等细分领域。

二、对百济神州 2025Q1 业绩的潜在影响

  1. 短期研发费用压力可控,长期商业化潜力显著 2025 年百济预计研发及管理费用合计 295 亿-319 亿元,此次临床试验的推进可能在 Q1 增加部分费用,但公司整体研发投入已进入规模化阶段,边际成本可控。BGB-C354 若能在 2025 年下半年取得概念验证数据,将为其后续商业化奠定基础,并可能通过对外授权(类似百利天恒与 BMS 的合作模式)提前兑现价值。

  2. 股价与市场信心提振 临床获批消息公布后,公司股价在 3 月 5 日上涨 2.99%,市值超 3247 亿元,反映了市场对其创新管线的认可。短期内可能通过资本市场融资缓解现金流压力,支撑后续研发投入。

  3. 对收入端的间接贡献有限,但战略意义重大 2025Q1 业绩仍主要依赖现有产品(如 BTK 抑制剂百悦泽 ®)的销售放量,而 BGB-C354 尚处早期临床阶段,对收入直接贡献较小。但该进展强化了公司在实体瘤领域的竞争力,有助于维持投资者对其长期增长逻辑的信心。

三、综合结论

  • CXO 行业:百济的 ADC 研发进展将推动 CXO 企业在高壁垒技术领域的订单增长,并加速中国 CXO 全球化服务能力的提升。
  • 百济神州:短期内 Q1 业绩受研发费用拖累有限,经营利润转正目标(2025 全年)仍可期;长期需关注 BGB-C354 的临床数据及后续管线兑现节奏。

风险提示:ADC 赛道竞争加剧可能导致临床开发成本超预期;若联合疗法的协同效应不及预期,可能影响后续商业化估值。

案例 3:联网搜索+推理模型数据搜集

对于需要检验结果的任务,建议使用推理模型

INFO

请联网搜索上交所、深交所、北交所等中国大陆股票交易所的网站中的 2025 休市安排,要求输出 2025 年所有休市日,计算 2025 年有多少个交易日(指非节假日、周末)?并列出每个休市日。最后输出一段结构化的代码,模仿示例中的结构格式,要求输出 2025 年所有休市日的年月日。

python
<example>
# Labor Day
or (y == 2024 and (1 <= d <= 3) and m == 5)
# Mid-Autumn Festival
or (y == 2024 and (16 <= d <= 17) and m == 9)
</example>
Details

根据上交所、深交所和北交所发布的 2025 年节假日休市安排,结合常规周末休市规则,2025 年的休市日及交易日数如下:


一、2025 年休市日列表

  1. 法定节假日休市

    • 元旦:2025-01-01
    • 春节:2025-01-28 至 2025-02-04(共 8 天)
    • 清明节:2025-04-04 至 2025-04-06(共 3 天)
    • 劳动节:2025-05-01 至 2025-05-05(共 5 天)
    • 端午节:2025-05-31 至 2025-06-02(共 3 天)
    • 国庆节 & 中秋节:2025-10-01 至 2025-10-08(共 8 天)
  2. 常规周末休市
    全年所有周六、周日(共 104 天),扣除与法定节假日重叠的 10 天(如春节期间的 2 月 1 日、2 月 2 日等)。


二、2025 年交易日计算

  • 全年总天数:365 天
  • 总休市天数:法定节假日 28 天 + 常规周末 104 天 - 重叠天数 10 天 = 122 天
  • 交易日数:365 - 122 = 243 天

三、结构化代码示例(休市日条件)

以下代码片段展示了 2025 年所有法定节假日休市日的判断逻辑(假设变量ymd分别表示年、月、日):

python
# 元旦
(y == 2025 and m == 1 and d == 1)
# 春节
or ((m == 1 and d >= 28) or (m == 2 and d <= 4)) and y == 2025
# 清明节
or (m == 4 and 4 <= d <= 6) and y == 2025
# 劳动节
or (m == 5 and 1 <= d <= 5) and y == 2025
# 端午节
or ((m == 5 and d == 31) or (m == 6 and d <= 2)) and y == 2025
# 国庆节 & 中秋节
or (m == 10 and 1 <= d <= 8) and y == 2025
# 常规周末(需额外判断是否为周六或周日)
or (is_weekend(y, m, d))  # 假设is_weekend函数判断是否为周末

参考资料

ps: 在上交所网站上核对过,Deepseek R1 671B 第一次输出就是正确的。

案例 4:简单任务直接描述

对于 OCR、文本转语音、语音转文本、表格处理等简单任务,简要表述效果往往更好。

案例 5:拆解复杂问题

我们希望 AI 帮忙生成雪球产品定价模型,但是市面上的大模型往往没有用场外衍生品等相关金融语料库进行训练。如果单纯使用零样本或有限样本的提示词,如“帮我生成一个自动敲入敲出型(autocallables)场外衍生品的估值定价模型”,这大概率是失败的。原因是大模型训练中没有针对金融行业的细分领域的知识库和语料库,也没有相对应的训练样本,除了编程问题,绝大部分都是样本外的知识,这非常考验模型的泛化和推理能力

以下案例必须使用有较强的泛化能力、参数量较大、擅长推理的大模型,在对任务拆解的同时尽可能把提示词写成伪代码的形式,便于大模型按照我的建模逻辑进行编程。

INFO

HTML
<description
  >雪球是指含有敲入敲出条款的不保本的结构化产品,雪球条款中最重要的三个要素分别是敲入水平,敲出水平及票息率。
  当投资者签订雪球场外衍生品条约后会出现一下三种情形:
  (1)如果标的指数在合约期限内某个交易日的收盘价低于敲入水平时,其收益相当于卖出一个看跌期权,且不获得票息。
  (2)如果标的指数在合约期限内的观察日的收盘高于敲出水平时,则提前终止合约并获得计息天数下的年化票息收益。这里如果标的指数先敲入之后再敲出,收益按敲出条款。
  (3)如果标的指数在合约期限内既未敲出也未敲入时,则获得全部年化票息收益。</description
>

<example
  >有一个雪球产品,敲出票息为年化20%,期初价格是100,初始是未敲入状态,期限为一年期,103敲出,75敲入,无风险利率为4%,波动率为25%,分红率为1%,名义本金为1000万元,雪球期初是2021年3月15日,期末是2022年3月15日,这样的雪球产品,我输入以上信息,估值日为期初,程序能返回雪球的价格是120193.33。</example
>

<process>
  该雪球产品定价模型基于蒙特卡洛模拟框架构建,核心逻辑可分为六个步骤: 1.
  日期系统构建
  业务日计数计算一年实际上中国大陆有多少个交易日,需要在上交所和深交所官网上找到休市日,再用365天减去不是休市日的周末和休市日,得到实际交易日的数量,预先生成好日历的时间序列,因为非交易日是不会有敲入和敲出观察的,如果遇到非交易日就必须延后到下一个交易日。票息计算采用ACT/365(一年365天)的实际天数规则,持有多久天就是多少天。这种双轨计时系统确保准确计算各观察日的时间权重,例如敲出观察日列表会转换为对应的交易日偏移量,保证路径模拟与真实交易日历同步。第一次敲入观察日期是雪球合约期初第一天之后的第三十天,如果遇到非交易日就往后延,以此类推,直到合约结束。
  2. 产品条款参数化
  设置三要素核心参数:敲入水平、敲出水平、票息率,每个月会观察一次敲出,而每天都会观察敲入,以当日收盘价为准。敲出观察日的票息金额预先计算并年化处理,第一个观察日是在签署合约期初日的一个月后。例如第一个观察日是在2021年1月31日敲出(期初是1日签署合约),期间内未敲入,对应31天计息周期,票息=20%*(31/365)*名义本金。非交易日不观察,需要延后,所以不同月份需要参考实际的天数计算距离。
  3. 布朗运动路径生成
  采用离散化几何布朗运动模型,时间步长Δt=1/实际交易日数量。通过伊藤引理离散形式:
  ΔlnS = (r-q-σ²/2)Δt + σ√Δt*ε
  其中ε~N(0,1)。代码使用累加对数收益率生成路径,避免浮点误差累积。例如初始spot=100时,生成包含到期日前所有交易日的价格序列。
  4. 障碍条件判定 路径验证采用循环迭代的方式,每次包括两阶段检查: -
  敲出优先检查:在每月一次的敲出观察日,若当日价格≥敲出水平,立即终止并贴现票息(贴现因子需使用无风险利率计算,贴现至期初日)
  - 敲入追溯:未敲出时每天检查收盘价格是否跌破敲入水平,触发后标记敲入状态 5.
  到期损益计算 根据最终状态决定现金流: - 发生敲入:支付看跌期权损失 max(行权价
  - 到期价,0) - 未触发任何障碍:获得最后一期全额票息
  所有现金流均按ACT/365规则用无风险利率贴现至估值日。 6. 并行计算优化
  利用multiprocessing库实现多进程并行计算,将百万次模拟任务分配至CPU多核处理。每个独立路径的模拟结果经汇总求平均得到期望价值,最终输出蒙特卡洛定价结果及计算耗时。
  该模型通过动态路径生成与障碍条件检测,准确捕捉雪球产品的路径依赖特性,并通过方差缩减技术可进一步提升计算效率。
</process>
<thinking>
  你是一个金融工程研究员,请用蒙特卡洛方法生成雪球产品的定价,蒙特卡罗的方法就是模拟每天的股票价格,严格按照每条路径进行日度敲入观测和月度敲出观测,并按照价格路径计算每种情况下雪球期权的收益,计算每条路径折现后的均值,用python代码实现,使用中国的日历,最终在合约期末的现金流折现之后,就能得到雪球合约的定价。要求程序的输入输出符合上述例子,价格偏差上述例子不得超过30%,请逐步思考并反复验证结果后输出,要求输出雪球定价模型的python代码及相关注释。
</thinking>
Details
python
import numpy as np
from datetime import date, timedelta
from dateutil.relativedelta import relativedelta
import multiprocessing as mp
import chinese_calendar as cn_cal

def generate_trading_days(start_date, end_date):
    """生成中国交易日历"""
    trading_days = []
    current_date = start_date
    while current_date <= end_date:
        # 排除周末和节假日(含调休)
        if current_date.weekday() < 5 and not cn_cal.is_holiday(current_date):
            trading_days.append(current_date)
        current_date += timedelta(days=1)
    return trading_days

def generate_knock_out_dates(start, end, trading_days_set):
    """生成每月敲出观察日(自动顺延到交易日)"""
    ko_dates = []
    current_month = start + relativedelta(months=1)  # 第一个观察日在一个月后

    while current_month <= end:
        # 寻找最近的交易日
        candidate = current_month
        while candidate <= end:
            if candidate in trading_days_set:
                ko_dates.append(candidate)
                break
            candidate += timedelta(days=1)
        current_month += relativedelta(months=1)
    return ko_dates

def monte_carlo_simulation(args):
    """单进程蒙特卡洛模拟"""
    (seed, n_paths, S0, K, KI, KO, r, q, sigma, T,
     trading_days, ko_dates, notional, coupon_rate) = args

    np.random.seed(seed)
    n_steps = len(trading_days)
    dt = T / n_steps
    ko_indices = [trading_days.index(d) for d in ko_dates]
    pv_sum = 0.0

    for _ in range(n_paths):
        # 生成价格路径
        lnS = np.log(S0)
        prices = [S0]
        for _ in range(1, n_steps):
            z = np.random.normal()
            lnS += (r - q - 0.5*sigma**2)*dt + sigma*np.sqrt(dt)*z
            prices.append(np.exp(lnS))

        # 敲出检查
        knocked_out = False
        for idx in ko_indices:
            if prices[idx] >= KO:
                days = (trading_days[idx] - trading_days[0]).days
                coupon = coupon_rate * days/365 * notional
                discount = np.exp(-r * days/365)
                pv_sum += coupon * discount
                knocked_out = True
                break

        if not knocked_out:
            # 敲入检查
            knocked_in = any(p <= KI for p in prices)
            sT = prices[-1]

            if knocked_in:
                # 卖出看跌期权
                payoff = max(K - sT, 0) * notional / K
                discount = np.exp(-r * T)
                pv_sum -= payoff * discount
            else:
                # 获得全额票息
                coupon = coupon_rate * notional
                discount = np.exp(-r * T)
                pv_sum += coupon * discount

    return pv_sum / n_paths

def price_snowball():
    """主定价函数"""
    # 输入参数
    S0 = 100
    KO = 103
    KI = 75
    coupon_rate = 0.20
    r = 0.04
    q = 0.01
    sigma = 0.25
    notional = 1e7
    start_date = date(2021, 3, 15)
    end_date = date(2022, 3, 15)
    T = 1.0

    # 生成交易日历
    trading_days = generate_trading_days(start_date, end_date)
    trading_days_set = set(trading_days)
    print(f"实际交易日数: {len(trading_days)}")

    # 生成敲出日期
    ko_dates = generate_knock_out_dates(start_date, end_date, trading_days_set)
    print(f"敲出观察日: {ko_dates[:3]} ...共{len(ko_dates)}个")

    # 并行计算参数
    n_simulations = 200000
    n_processes = mp.cpu_count()
    n_per_process = n_simulations // n_processes

    # 准备参数
    args = [(i, n_per_process, S0, S0, KI, KO, r, q, sigma, T,
            trading_days, ko_dates, notional, coupon_rate)
           for i in range(n_processes)]

    # 启动多进程
    with mp.Pool(n_processes) as pool:
        results = pool.map(monte_carlo_simulation, args)

    # 计算结果
    price = np.mean(results)
    print(f"雪球产品估值: {price:.2f}")

if __name__ == "__main__":
    price_snowball()

通过雪球建模案例的实践,能够深刻理解到大模型泛化能力的重要性,选择一个擅长推理且参数量足够大的模型至关重要。

案例 4:向书提问

检索增强生成(RAG)旨在通过检索和整合外部知识来增强大语言模型生成 文本的准确性和丰富性,其是一个集成了外部知识库、信息检索器、大语言模型等 多个功能模块的系统。RAG 利用信息检索、深度学习等多种技术为大语言模型在 生成过程中引入最新的、特定领域的知识,从而克服传统大语言模型的局限性,提 供更加精准和可靠的生成内容。

其通常集成了外部知识库(Corpus)、信息检索器(Retriever)、生成器(Generator,即大语言模型)等多个功能模 块。通过结合外部知识库和大语言模型的优势,大幅提升模型在开放域问答、多轮对话等任务中的生成质量。具体而言,给定一个自然语言问题(Query),检索器将问题进行编码,并从知识库(如维基百科)中高效检索 出与问题相关的文档。然后,将检索到的知识和原始问题一并传递给大语言模型,大语言模型根据检索到的知识和原始问题生成最终的输出。RAG 的核心优势在于不需要对大语言模型的内部知识进行更新,便可改善大语言模型的幻觉现象,提高生成质量。这可以有效避免内部知识更新带来的计算成本和对旧知识的灾难性遗忘(Catastrophic Forgetting)。

NotebookLM

我导入了期权经典教材《麦克米伦谈期权》、《期权期货及其他衍生产品》等电子版 PDF,注意必须是含有能读取的文本而非扫描版,才能被正确检索。

INFO

你是一位金融分析师,请用期权构建一组期权策略,我们预计未来将出现牛市,宽基指数大幅上涨的情形,我们要在一年内把握住任何大幅上涨的可能性,但需要以较低的成本,而且必须克服长时间和低波动的损耗,只有极少概率是波动率聚类的,请你考虑到市场的尾部风险后,构建对未来乐观的期权策略,请逐步思考,请用中文输出。

Details

好的,作为一位金融分析师,考虑到您对未来一年内宽基指数大幅上涨的乐观预期,同时希望以较低的成本把握上涨机会,并克服时间衰减和低波动的影响,且考虑到极少概率的波动率聚类以及市场尾部风险,我将逐步构建以下期权策略供您参考:

第一步:理解您的核心需求与限制

  • 看涨预期且幅度较大: 核心是捕捉指数的显著上涨。
  • 较低成本: 需要避免直接购买大量长期看涨期权带来的高溢价。
  • 克服时间衰减和低波动: 纯粹的长期看涨期权在上涨缓慢或波动率不高时会受到时间价值损耗。
  • 极少概率的波动率聚类: 策略不应过度依赖波动率的显著变化,或者在波动率突然上升时受到严重负面影响。
  • 市场尾部风险: 需要考虑在极端不利情况下(即使概率很低)的潜在损失,最好是有限损失。
  • 一年期限: 策略构建需要考虑期权合约的到期时间。

第二步:初步筛选期权策略类型

基于您的需求,以下策略类型可能值得考虑:

  • 看涨期权价差 (Bull Call Spread): 通过买入低行权价看涨期权,同时卖出高行权价看涨期权,来降低成本并限定潜在利润。这是一种成本相对较低且风险有限的策略。
  • 卖出看跌期权 (Selling Put Options): 如果您认为指数不太可能大幅下跌,卖出看跌期权可以获得权利金收入,并在指数高于行权价时盈利。但需要注意潜在的下行风险. 可以考虑构建看跌期权价差 (Bull Put Spread) 来限制下行风险,即卖出较高行权价看跌期权,同时买入更低行权价看跌期权。
  • 跨式期权策略 (Straddle/Strangle) 的变形: 虽然跨式期权通常用于押注大幅波动,但在您的乐观预期下,可以考虑买入看涨期权,并同时卖出虚值看跌期权来降低成本,但需要密切关注下行风险。
  • 日历价差/对角价差 (Calendar/Diagonal Spreads): 利用不同到期时间和/或行权价的期权组合,旨在从时间价值衰减中获利,并可能在标的资产价格朝有利方向移动时获利。

第三步:构建具体期权策略并考虑尾部风险

考虑到您的核心需求和风险偏好,我将重点介绍以下几种策略,并分析其优缺点和对尾部风险的应对:

  • 策略一:长期看涨期权价差 (Long-Dated Bull Call Spread)

    • 构建方式: 买入一个一年期、较低行权价的看涨期权,同时卖出一个相同到期日、较高行权价的看涨期权。行权价的选择应基于您对指数上涨幅度的预期。
    • 优点:
      • 成本相对较低: 卖出高行权价的看涨期权可以部分抵消买入低行权价看涨期权的成本。
      • 风险有限: 最大损失被限定在构建价差时支付的净权利金。这有效地应对了尾部风险造成的极端下跌。
      • 克服时间衰减的部分影响: 虽然长期期权也有时间价值衰减,但相对于短期期权,衰减速度较慢。
    • 缺点:
      • 利润有限: 最大利润被限定在两个行权价之间的差额减去净成本。如果指数大幅超出高行权价,额外收益将被放弃。
      • 需要指数上涨才能盈利: 如果指数在到期时低于或接近较低行权价,可能会产生亏损。
      • 低波动影响: 如果在持有期间波动率没有显著上升,期权价值的增长可能较慢。
    • 应对波动率聚类: 由于风险有限,即使出现短暂的波动率上升,最大损失仍然可控。
  • 策略二:卖出远期虚值看跌期权,并买入更低行权价的看跌期权进行保护 (Bull Put Spread)

    • 构建方式: 卖出一个一年期、远低于当前指数价格的虚值看跌期权,同时买入一个相同到期日、更低行权价的看跌期权。
    • 优点:
      • 获得权利金收入: 卖出看跌期权可以立即获得收入。
      • 若指数不跌反涨则盈利: 当指数价格高于卖出的看跌期权行权价时,您可以获得最大利润(收到的净权利金)
      • 风险有限: 买入更低行权价的看跌期权限定了您的最大潜在损失。这有效地应对了尾部风险造成的极端下跌。
      • 受益于时间衰减: 您是看跌期权的空头,时间价值的衰减对您有利。
    • 缺点:
      • 利润有限: 最大利润仅为收到的净权利金
      • 需要指数保持在一定水平之上: 如果指数大幅下跌到较低行权价之下,将遭受最大损失。
      • 低波动影响: 低波动环境可能使得卖出的看跌期权权利金不高。
    • 应对波动率聚类: 短期的波动率上升可能会导致买入的看跌期权价值增加,部分对冲卖出看跌期权的损失。
  • 策略三:对角看涨期权价差 (Diagonal Bull Call Spread)

    • 构建方式: 买入一个较长期(例如,一年期)、较低行权价的看涨期权,同时卖出一个较短期(例如,3-6 个月)、较高行权价的看涨期权。
    • 优点:
      • 成本可能更低: 通过卖出较短期的看涨期权,可以更有效地降低初始成本。
      • 利用时间价值衰减: 较短期的看涨期权的时间价值衰减更快,您可以从中获利。
      • 若指数温和上涨,可能获得较好收益: 在短期看涨期权到期时,如果指数位于两个行权价之间,您可以保留长期看涨期权的价值。
    • 缺点:
      • 管理复杂性较高: 需要在短期看涨期权到期时进行管理,例如平仓、展期或调整策略。
      • 对时间把握要求高: 需要指数在短期看涨期权到期前有一定的上涨。
      • 尾部风险仍然存在: 如果指数大幅下跌,长期看涨期权仍会损失价值。
      • 波动率影响复杂: 短期和长期期权的波动率变化会共同影响策略盈亏。
    • 应对波动率聚类: 如果波动率在短期期权到期前上升,可能导致短期期权价值增加,带来损失。

第四步:考虑“极少概率是波动率聚类的”

由于您认为波动率大幅且频繁的上升概率较低,因此可以相对放心地采用卖出期权的策略(如策略二),但务必控制好卖出期权的行权价,留有足够的安全边际,并利用买入期权进行保护。

第五步:应对市场尾部风险

所有推荐的策略(长期看涨期权价差和牛市看跌期权价差)都通过买入期权的方式限定了最大损失。这在面对极端的市场下跌时提供了保护,避免了无限的潜在亏损。对角看涨期权价差虽然没有直接限定下行风险,但其买入的长期看涨期权在一定程度上也能缓冲下跌带来的损失。

第六步:总结推荐策略

基于您的需求和限制,我重点推荐策略一(长期看涨期权价差)和策略二(牛市看跌期权价差)

  • 长期看涨期权价差成本相对可控,风险明确,并能在指数上涨时提供可观的利润(虽然有限)。
  • 牛市看跌期权价差通过卖出看跌期权获得收入,并在指数保持在一定水平之上时盈利,同时买入更低行权价的看跌期权来限制下行风险。

**策略三(对角看涨期权价差)**可以作为更积极的选择,但需要更精细的管理和对市场时机的把握。

第七步:重要提示

  • 期权交易涉及风险,即使是限定风险的策略也可能导致亏损。
  • 请务必根据您的风险承受能力和对市场走势的深入分析来选择具体的行权价和到期日。
  • 建议您在实际交易前进行充分的模拟交易,以便更好地理解这些策略的运作方式和潜在风险。
  • 持续关注市场动态和波动率变化,必要时对持仓进行调整。

希望以上分析对您有所帮助。请记住,这仅为策略构建的初步探讨,具体的执行方案需要您结合自身的实际情况进行决策。

用英文问同样的问题,让 Gemini 去检索里边唯一的英文书《Financial Mathematics, Derivatives and Structured Products》:

NotebookLM

相关应用:Notion、Google 家的NotebookLM

总结

提示词工程终将会消失,未来的 AI 为了更好的用户体验会尽可能拟合白话,降低使用门槛。提示词工程最终会被侧端 AI、具身智能、AI Agent 等实际应用所取代。提示词工程是大语言模型和 AGI 之间的过度产物。

  • 了解你将要使用的模型:首先是选择正确的模型,目前分为通用大语言模型(如 GPT-4、Deepseel R3、Qwen)、推理模型(如 GPT-o1、Deepseek R1、QwQ)、长文本模型、图片语音生成模型(如 Dall-e)和多模态等;其次,了解完成既定任务所需的参数量,例如完成总结文章或做一定的数学推理,至少要 32B 模型是才可以胜任的;遇到复杂问题,尽可能使用性能最好且参数量较大的模型,冷门问题就需要用特定数据来补充信息来源,并用检索增强生成(RAG)技术做知识增强,避免大模型幻觉;
  • 使用提示词框架:情景角色说明、上下文背景、输入输出限制;
  • 提示词结构化:HTML、XML、Markdown、LaTeX、Mermaid;
  • 提供思维链和样本提示:提供多样本搜索提示/有限样本提示/引导自动生成思维链;
  • 拆解复杂任务:引导大模型按既定的思维和逻辑完成任务,必要时拆解成多个子任务,提示词写成伪代码形式(介于自然语言与编程语言之间);
  • 阅读技术文档:每个大模型背后都提供了最佳实践案例和 API 调用的方法,遇到问题多到 Github 和 Stackoverflow 上搜,自行折腾多做 A/B 对照测试,少迷信各种付费教材,大部分学习资源都是开源和免费的。

参考资料

大模型基础,浙江大学.https://github.com/ZJU-LLMs/Foundations-of-LLMs

https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/chain-of-thought

https://www.promptingguide.ai/

OpenAI 的提示词工程文档.https://platform.openai.com/docs/guides/prompt-engineering#tactic-include-details-in-your-query-to-get-more-relevant-answers

https://cookbook.openai.com/

Last updated: