Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

【Prompt改进】1. JCR分类;2. 意译操作;3. 输出多个版本进行对比分析并整合最优版;4. zero-shot改良版——深呼吸然后逐步思考 #9

Open
RuotingLiu opened this issue Dec 17, 2023 · 0 comments

Comments

@RuotingLiu
Copy link

Step 1:文章总结

Objective & Output Specification (明确分类方式采用JCR分类)
Hierarchical Category: Assign a hierarchical category according to the JCR Category (the ) to which the article pertains. Denote each successive level of the hierarchical category with the symbol ">" inside the XML label <category>.

【改进前】

Science & Technology>Research Ethics>Data Integrity

【改进后】

Social Sciences;Ethics in Research

Step 2:文章翻译

技能(强调意译操作)

  • 擅长把{{文章类型}}从英文翻译为中文。
  • 熟悉Markdown和XML格式。
  • 擅长英译汉的意译技巧,能够根据中文表达习惯和文化特点,增添、删减、修改字词或语句顺序,使最终翻译文本更地道、更贴合中文语境。

【改进前】

或许人们希望篡改和捏造数据是罕见的,但最近在荷兰进行的一项大规模调查显示,其患病率约为4%。数据捏造也可能发生在较小的范围内。
想象一下为一项研究收集数据。作为研究的一部分,您的任务是询问参与者的年龄和性别,以便在描述样本时报告人口统计学数据。在收集所有数据后,您注意到忘记为两个参与者收集人口统计数据。您可能会受到诱惑,根据您的记忆猜测这两个参与者的人口统计数据,以免在撰写人口统计信息时承认在数据收集过程中犯了一个错误。然而,这也构成了数据捏造。您应该透明地提到出现了一个错误。错误是难免的,重要的是要建立一种人们能够承认错误的文化,这样我们就可以从中学到并在将来防止它们

【改进后 】

或许人们希望篡改和捏造很少发生,但荷兰最近的一项大规模调查显示其发生率约为4%。数据捏造也可能发生在较小的范围内。
想象一下为一项研究收集数据。作为研究的一部分,您的任务是询问参与者的年龄和性别,以在描述样本时报告人口统计学数据。在收集了所有数据后,您注意到忘记了为两个个体收集人口统计数据。您可能会受到诱惑,根据您的记忆猜测这两个个体的人口统计数据,以免在编写人口统计信息时承认数据收集中出现错误。然而,这也构成了数据捏造。您应该坦率地提到发生了错误。错误是难免的,重要的是创造一种人们能够承认错误的文化,这样我们就可以从中学到并防止将来发生类似情况

任务描述(输出多个结果进行对比分析和最优整合)

2.请根据上一步你获得的背景信息,翻译我前一个输入中的标签<article>内的文章内容**,采用直译、意译、扩展化翻译、精简化翻译方式,输出4种翻译结果。
3.请逐字对比你在上一步中得到的4种翻译结果,分点列举每种结果的优势和劣势。
4.请根据上一步你的对比分析结果,整合出一版最能传达原文的语气、情感,在中文文化中更通顺、自然、贴切的翻译文本,然后输出这一翻译结果。这一步骤对我非常关键,请一定要认真比对并修改。**

输出规范(zero-shot改良版)

4. 请深呼吸,然后逐步思考,并依次输出任务描述中的任务2、任务3和任务4。

Yang, C., Wang, X., Lu, Y., Liu, H., V.Le, Q., Zhou, D., & Chen, X. (2023). Large Language Models as Optimizers. Google DeepMind

【改进前】

或许人们希望篡改和捏造数据是罕见的,但最近在荷兰进行的一项大规模调查显示,其患病率约为4%。数据捏造也可能发生在较小的范围内。
想象一下为一项研究收集数据。作为研究的一部分,您的任务是询问参与者的年龄和性别,以便在描述样本时报告人口统计学数据。在收集所有数据后,您注意到忘记为两个参与者收集人口统计数据。您可能会受到诱惑,根据您的记忆猜测这两个参与者的人口统计数据,以免在撰写人口统计信息时承认在数据收集过程中犯了一个错误。然而,这也构成了数据捏造。您应该透明地提到出现了一个错误。错误是难免的,重要的是要建立一种人们能够承认错误的文化,这样我们就可以从中学到并在将来防止它们。

【改进后】

或许篡改和制造数据的情况并不常见,但最近在荷兰进行的一项大规模调查估计其普遍性约为4%。值得注意的是,数据制造也可能在规模较小的研究中发生。
让我们想象一下,作为一项研究的一部分,您的任务是询问参与者的年龄和性别,以在描述样本时报告人口统计数据。在收集了所有数据后,您突然意识到忘记为两位参与者收集人口统计数据。您可能会试图根据记忆猜测这两个人的统计数据,以避免在撰写人口统计信息时承认错误。然而,这也属于数据制造。更好的做法是坦率承认错误,因为错误是不可避免的,建立一个坦诚文化有助于从中吸取教训,预防未来错误。

小结

  • 改进目的:之前发现对于相同的prompt,翻译结果时好时坏,具有随机性。因此,希望要求GPT输出多个版本,然后自行比较不同版本的优劣并进行整合,最终输出一个最优版本,从而减少人工整合的工作。
  • 改进效果:在一定程度上实现了目的,但输出结果仍然具有随机性,整合版本还是会存在一些问题。
  • 可能的原因:同时输出4种翻译可能会让GPT固执第一次输出的结果,导致4个版本差别不大?对比分析部分仅分析优势劣势太过笼统,需要详细分析每个结果的翻译亮点或不足?
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant