13 从头实现一个Agent
上一讲,我们已经从概念上了解了 Agent。你现在知道 Agent 其实也是一个软件系统,只不过,因为有了大模型的加持,它有了一个可以做“自主”推理的大脑,完成很多“智能”的工作。
这一讲,我们来实现一个 Agent。不同于之前借助 LangChain,这次我们会用更底层的方式实现一个 Agent,帮助你更好地理解 Agent 的运作原理。
我们构建这个 Agent 会基于 ReAct 来实现,我们在 04 讲介绍过,ReAct 表示 Reasoning + Acting,也就是推理和行动。采用这个模式,要经历思考(Thought)、行动(Action)、观察(Observation)三个阶段。
我们的实现代码参考了 Simon Willison 的一篇文章,这篇文章介绍了如何用 Python 实现 ReAct 模式。
from openai import OpenAI
DEFAULT_MODEL = "gpt-4o-mini"
client = OpenAI()
class Agent:
def __init__(self, system=""):
self.system = system
self.messages = []
if self.system:
self.messages.append({"role": "system", "content": system})
def invoke(self, message):
self.messages.append({"role": "user", "content": message})
result = self.execute()
self.messages.append({"role": "assistant", "content": result})
return result
def execute(self):
completion = client.chat.completions.create(
return completion.choices[0].message.content
我们采用了直接的 OpenAI Python 库实现:
- 初始化的时候,我们可以传入系统提示词给这个 Agent 做一些初始的设定。
是我们维护的历史消息列表,如果设定了系统提示词,就把它加到历史消息里。 invoke
的值是 0,因为这里用到的是大模型的推理过程,所以,我们希望确定性强一些。另外,这里我们使用了同步处理,因为我们这里是把大模型当作推理引擎,需要等待所有的内容回来。
ReAct 提示词
要创建一个基于 ReAct 的 Agent,关键是要有一个特定的提示词。下面是我们这个例子里的提示词:
prompt = """
You run in a loop of Thought, Action, PAUSE, Observation.
At the end of the loop you output an Answer
Use Thought to describe your thoughts about the question you have been asked.
Use Action to run one of the actions available to you - then return PAUSE.
Observation will be the result of running those actions.
Your available actions are:
e.g. calculate: 4 * 7 / 3
Runs a calculation and returns the number - uses Python so be sure to use floating point syntax if necessary
e.g. ask_fruit_unit_price: apple
Asks the user for the price of a fruit
Example session:
Question: What is the unit price of apple?
Thought: I need to ask the user for the price of an apple to provide the unit price.
Action: ask_fruit_unit_price: apple
You will be called again with this:
Observation: Apple unit price is 10/kg
You then output:
Answer: The unit price of apple is 10 per kg.
这段提示词分成了三个部分,ReAct 描述、可用的动作和示例。
ReAct 描述,给大模型解释了ReAct 的三个阶段:思考(Thought)、行动(Action)、观察(Observation)。这里还多了一个暂停(Pause),其主要的目的就是停下来,这时执行流程就回到我们这里,执行相应的动作。当动作执行完毕,再把控制权返回给大模型。
最后是一个示例,展现了一个完整的思考过程。从问题开始,大模型给出了怎样的思考,做出了哪些动作,然后将观察结果返回给大模型,最终大模型给出了输出。这里给出的示例,是为了供大模型更好地参考,还记得我们在提示工程中讲过的少样本提示吗?这个提示词就是 ReAct 和少样本提示的结合。
def calculate(what):
return eval(what)
def ask_fruit_unit_price(fruit):
if fruit.casefold() == "apple":
return "Apple unit price is 10/kg"
elif fruit.casefold() == "banana":
return "Banana unit price is 6/kg"
return "{} unit price is 20/kg".format(fruit)
采用了 Python 本身的 eval 机制实现,而 ask_fruit_unit_price
则实现了不同水果价格。如你所见,这两个函数都很简单,但它们怎样实现并不重要,重点是我们有了一个接口去实现自己的机制,我们可以调用一些外部 API 去查询也好,去执行一个操作也罢,这样,Agent 就能跳出大模型本身的限制了。所以,动作代码是我们发挥想象力的重要一环。
我们要实现 Agent 的基础组件都有了,接下来,我们就把它们组合到一起。
action_re = re.compile(r'^Action: (\w+): (.*)$')
known_actions = {
"calculate": calculate,
"ask_fruit_unit_price": ask_fruit_unit_price
def query(question, max_turns=5):
i = 0
agent = Agent(prompt)
next_prompt = question
while i < max_turns:
i += 1
result = agent.invoke(next_prompt)
actions = [action_re.match(a) for a in result.split('\n') if action_re.match(a)]
if actions:
# There is an action to run
action, action_input = actions[0].groups()
if action not in known_actions:
raise Exception("Unknown action: {}: {}".format(action, action_input))
print(" -- running {} {}".format(action, action_input))
observation = known_actions[action](action_input)
print("Observation:", observation)
next_prompt = "Observation: {}".format(observation)
这里我们实现了一个 query
万事俱备,我们来执行一下。我们问一个问题:3 千克苹果和 2 千克香蕉一共多少钱?
Agent 输出的结果如下:
Thought: To find the total price, I need to know the price per kilogram of both apples and bananas. I will ask for the price of each fruit.
Action: ask_fruit_unit_price: apple
-- running ask_fruit_unit_price apple
Observation: Apple unit price is 10/kg
Thought: Now that I have the price for apples, I need to ask for the price of bananas to calculate the total price for 1 kg of apples and 2 kg of bananas.
Action: ask_fruit_unit_price: banana
-- running ask_fruit_unit_price banana
Observation: Banana unit price is 6/kg
Thought: I now have the prices for both fruits. The price of apples is 10/kg and the price of bananas is 6/kg. I can calculate the total price for 1 kg of apples and 2 kg of bananas.
Action: calculate: 1 * 10 + 2 * 6
-- running calculate 1 * 10 + 2 * 6
Observation: 22
Answer: The total price of 1 kg of apples and 2 kg of bananas is 22.
- 第一步的思考是要计算总价,那么就需要先知道单价。所以,第一个动作是询问苹果的价格。
- 我们执行
这个动作,其参数是 apple。我们得到苹果单价之后,再把它作为观察结果,发送给大模型。 - 第二步的思考是,已知苹果价格,要计算总价还要得到香蕉价格。
- 我们执行
这个动作,其参数是 banana,同样,把单价作为观察结果返回给大模型。 - 第三步的思考是,两个单价都有了,就可以计算总价了,调用
这个动作,参数是一个表达式:1 * 10 + 2 * 6。 - 我们执行这个计算,得到结果是 22,把它返回给大模型。
- 最后的思考是,已经得到答案,无需继续执行了,把结果返回回来。
当然,这是一个比较简单的问题,如果问题复杂,可能轮数会大幅度增加,极端情况下,甚至会出现无法收敛的情况,也就是一轮一轮地不断问下去,这会造成极大的成本消耗。所以,在设计 Agent 的时候会限制最大询问次数, query
函数的 max_turns
好了,到这里,你应该对如何实现一个 Agent 有了一个初步的了解。上面的代码对于任何一个程序员来说都可以轻松理解。我们的重点是了解在这个过程中,代码是如何与大模型配合的,比如,我们之所以能找到执行的动作及其参数,是因为我们给大模型的提示词里对输出提了要求。再比如,大模型之所以能够不断地思考,是因为我们把聊天历史传给了大模型,让它对当前的上下文有了理解。
有了这个简单的例子作为基础,当我们再去看更复杂的 Agent 时,就更能理解背后的运作机制,而不致于迷失其中了。
这一讲,我们抛开了 LangChain,用更底层的方式实现了一个基于 ReAct 框架的 Agent。我们看到了如何编写一个 ReAct 提示词,让大模型通过思考(Thought)、行动(Action)、观察(Observation)来完成更多的工作。
在我们这个例子里,规划是通过 ReAct 提示词完成的,记忆是通过聊天历史实现的,而动作则是通过一个一个的函数实现的。
如果今天的内容你只能记住一件事,那请记住,Agent 的执行过程本质上就是一个循环,由大模型引导着一次次地做着各种动作,以达成我们的目标。
尝试修改我提供的例子,给它增加一些动作,让这个 Agent 实现更多的能力。欢迎在留言区分享你的改造心得。
- hellotong 👍(1) 💬(1)
2024-11-29 - kergee 👍(0) 💬(1)
和 Function Calling 的区别呢?
2025-02-15 - grok 👍(3) 💬(0)
本节代码在此:https://github.com/groklab/misc/blob/main/geektime-llm-zhengye-column/lec13.ipynb2024-12-01query("三公斤苹果和两公斤香蕉的总价?") --- Thought: To calculate the total price of three kilograms of apples and two kilograms of bananas, I first need to know the unit price of each fruit. Action: ask_fruit_unit_price: apple PAUSE -- running ask_fruit_unit_price apple Observation: Apple unit price is 10/kg Thought: Now that I have the price of apples, I need to ask for the price of bananas to proceed with the calculation. Action: ask_fruit_unit_price: banana PAUSE -- running ask_fruit_unit_price banana Observation: Banana unit price is 6/kg Thought: I now have the unit prices for both apples and bananas. I can calculate the total price by multiplying the quantity of each fruit by its unit price and then summing these amounts. Action: calculate: 3 * 10 + 2 * 6 PAUSE -- running calculate 3 * 10 + 2 * 6 Observation: 42 Answer: 三公斤苹果和两公斤香蕉的总价是42元。
- 张申傲 👍(1) 💬(0)
2025-01-24 - willmyc 👍(1) 💬(0)
老师,您好有几个问题 1.query("What is the total price of 3kg of apple and 2kg of banana?")这个prompt和输出的不匹配 2.re.compile 需要导入包,import re 3.为了方便理解,老师后续的代码是否可以增加一点注释,谢谢您!