Mastering prompt engineering
Version 1.0 - 14/05/2025

Mục lục

Giới thiệu

Trong thời đại công nghệ số hiện nay, việc khai thác tối đa sức mạnh của trí tuệ nhân tạo thông qua kỹ thuật prompt đang ngày càng trở nên quan trọng. Tuy nhiên, có rất nhiều nguồn thông tin đang phổ biến những lời khuyên chung chung, thiếu căn cứ hoặc quá trình lý giải chưa rõ ràng, dễ dẫn đến hiểu lầm và cách áp dụng không hiệu quả. Điều này gây ra tình trạng lãng phí thời gian, công sức, đồng thời làm giảm khả năng tận dụng tiềm năng thật sự của AI.

Với hơn mười năm kinh nghiệm trong lĩnh vực công nghệ phần mềm, cùng quá trình nghiên cứu và tổng hợp từ các nguồn uy tín như OpenAI, Google, Anthropic, tôi mong muốn chia sẻ đến quý độc giả kiến thức nền tảng và các phương pháp thực tiễn nhằm tối ưu hóa việc thiết kế prompt. Mục tiêu của tôi là giúp quý vị tiếp cận công nghệ AI một cách đúng đắn, hiệu quả và mang lại giá trị cao nhất trong công việc cũng như các dự án phát triển cá nhân.

Những nguồn tin không chính thống sẽ làm bạn dễ dàng tin vào các mẹo vặt, nhưng thực tế lại không hiệu quả. Hoặc tệ hơn, khiến bạn hiểu sai về cách AI hoạt động. Đa phần áp dụng zero-shot prompting và phụ thuộc phần lớn vào khả năng của mô hình. Vậy zero-shot prompting là gì?

Zero-shot prompting

Zero-shot prompting là kỹ thuật tương tác với mô hình ngôn ngữ lớn (LLM) mà không cần cung cấp bất kỳ ví dụ minh họa nào. Nó dựa vào khả năng tổng quát hóa kiến thức của LLM.

Về cơ bản, cách thức hoạt động của LLM là dự đoán từ tiếp theo dựa trên ngữ cảnh, vậy nên khi chúng nhận được một prompt rõ ràng, chúng có thể áp dụng kiến thức đã học để tạo ra phản hồi phù hợp.

Tôi không cho rằng kỹ thuật zero-shot prompt là sai. Thật sự, nó sẽ rất tuyệt vời khi chúng ta có thể làm việc với AI chỉ bằng những yêu cầu đơn giản, gần như không cần phải hiểu rõ cách thức thực hiện. Tuy nhiên, tại thời điểm hiện tại, AI vẫn chưa đạt đến trình độ như vậy.

Ưu điểm

1. Đơn giản: Zero-shot prompting không đòi hỏi dữ liệu bổ sung, khiến nó trở nên có giá trị trong các trường hợp dữ liệu liên quan khó tìm kiếm hoặc khan hiếm.

2. Linh hoạt: Prompt dễ điều chỉnh khi cần thiết. Việc cải thiện hoặc cập nhật prompt đòi hỏi ít công sức.

3. Đa dạng: Zero-shot prompting thể hiện khả năng ấn tượng trong việc khai thác hiểu biết của LLM trên nhiều lĩnh vực đa dạng.

Hạn chế

1. Phụ thuộc nhiều vào khả năng của mô hình: Mô hình có thể không hiểu được prompt hoặc không có kiến thức trong lĩnh vực đó.

Ví dụ với Llama 3.1: Prompt: Hãy viết 1 câu truyện cười dài khoảng 200 từ bằng tiếng Việt. Kết quả là lỗi lặp token bât tận hoặc chuỗi các kí tự ngẫu nhiên.
Sau đó, đưa chính tài liệu này vào ngữ cảnh. Prompt: Zero-shot prompting là gì? Kết quả: Zero-shot prompt là một kỹ thuật trong việc thiết kế câu hỏi (prompt) cho các mô hình trí tuệ nhân tạo (AI), đặc biệt là các mô hình ngôn ngữ lớn (LLM), nơi mà mô hình được yêu cầu thực hiện một nhiệm vụ mà không có bất kỳ ví dụ cụ thể nào về cách thực hiện nhiệm vụ đó. Lyon và Garman (2000) đã định nghĩa zero-shot learning như là một phương pháp mà mô hình có thể áp dụng kiến thức đã học được từ các nhiệm vụ khác đến một nhiệm vụ mới mà không cần đào tạo lại...
Vậy, không phải Llama 3.1 không hiểu tiếng Việt. Trong tài liệu, tôi không viết chính xác những gì mà Llama đã trả lời. Đó là do tôi đã cung cấp đầy đủ tài liệu về đáp án mà tôi mong muốn.

2. Phụ thuộc vào chất lượng prompt: Hiệu quả của zero-shot prompting phụ thuộc rất nhiều vào việc prompt được viết rõ ràng và cụ thể như thế nào.

Trong ví dụ trên, tôi đã không thể tìm thấy thông tin về Lyon và Garman trên google. Vậy nên tôi phải yêu cầu thật rõ ràng những gì tôi mong muốn.

Prompt: Zero shot prompt là gì? Hãy trả lời ngắn gọn bằng những thông tin đã cung cấp bằng tiếng Việt. Kết quả: Zero-shot prompt là kỹ thuật yêu cầu AI thực hiện nhiệm vụ mà không cung cấp ví dụ cụ thể. AI sẽ dựa vào hiểu biết sẵn có từ quá trình đào tạo để đưa ra phản hồi, không cần dữ liệu tham chiếu hoặc hướng dẫn cụ thể từ người dùng. Ví dụ: "Hãy viết một bài thơ về mùa xuân" mà không cho bất kỳ ví dụ bài thơ nào.

3. Khó khăn với nhiệm vụ phức tạp: Đối với các nhiệm vụ đòi hỏi suy luận phức tạp hoặc định dạng đặc biệt, zero-shot có thể không hiệu quả bằng các phương pháp khác như few-shot.

Prompt: Hãy ghép các chữ cái sau để có từ tiếng Việt hoàn chỉnh: o / ã / h / h / n / à Kết quả: Từ tiếng Việt hoàn chỉnh ghép từ các chữ cái: hoành

4. Kết quả không nhất quán: Không có ví dụ để hướng dẫn, mô hình có thể tạo ra kết quả khác nhau cho cùng một prompt, tùy thuộc vào cách diễn đạt.

Vẫn là ví dụ trên, mỗi lần tôi thực hiện, kết quả sẽ khác nhau.

1. Từ tiếng Việt hoàn chỉnh có thể ghép từ các chữ cái: hoàn hả. 2. Các chữ cái bạn đưa ra là: o / ã / h / h / n / à Một từ tiếng Việt hoàn chỉnh có thể ghép được là: "hành hạ"; 3. Các chữ bạn đưa ra là: o / ã / h / h / n / à. Ghép lại thành từ tiếng Việt hoàn chỉnh, một từ có khả năng đúng là: "hào hãn"

Một vài ứng dụng mà Zero-Shot Prompting có thể thực hiện hiệu quả

1. Phân loại văn bản:

Phân loại đoạn văn sau vào một trong các thể loại: chính trị, kinh tế, thể thao, giải trí: [đoạn văn]

2. Tóm tắt văn bản:

Tóm tắt bài viết sau trong 3 điểm chính: [nội dung bài viết]

3. Phân tích cảm xúc:

Phân tích cảm xúc của nhận xét khách hàng sau và cho biết đó là tích cực, tiêu cực hay trung tính: [nhận xét khách hàng]

4. Chuyển đổi định dạng dữ liệu:

Chuyển đổi văn bản sau thành bảng JSON với các trường: tên, tuổi, nghề nghiệp và sở thích: [văn bản mô tả]

Zero-shot prompting rất hữu dụng với tác vụ đơn giản. Tôi đã chờ đợi rất lâu để có thể thực hiện tác vụ phức tạp hơn chỉ với vài câu prompt đơn giản. Nhưng để tận dụng AI ngay ngày hôm nay, chúng ta cần phải có chiến thuật.

Xác định tiêu chí

Trước khi bắt đầu thiết kế prompt, điều quan trọng nhất là bạn phải xác định rõ ràng mục tiêu và tiêu chí thành công của mình. Nếu không, bạn sẽ đánh giá kết quả theo cảm tính và không có sự đo lường. Thay vì để LLM tự tìm đường, hãy xác định chính xác bạn muốn gì và làm thế nào để biết đã đạt được mục tiêu đó.

Tiêu chí tốt là:

Cụ thể (Specific): Phải rõ ràng, chính xác về mục tiêu của bạn.

Ví dụ: Viết một bài đăng blog dài 500 từ về tác dụng của cà phê đối với sức khỏe, dành cho độc giả không chuyên. Bao gồm ít nhất 3 nguồn tham khảo.

Đo lường được (Measurable): Phải có các chỉ số hoặc thang đo rõ ràng.

Như trong ví dụ trên, tiêu chí thành công là bài viết phải dài 500 từ và có ít nhất 3 nguồn tham khảo.

Khả thi (Achievable): Mục tiêu dựa trên kinh nghiệm, benchmark ngành, hoặc nghiên cứu trước đó. Không nên đề ra mục tiêu quá cao, vượt quá khả năng hiện tại của mô hình.

Phù hợp (Relevant): Căn chỉnh tiêu chí tùy theo mục đích và nhu cầu của bạn. Độ chính xác cao có thể rất quan trọng đối với các ứng dụng y tế nhưng ít quan trọng hơn đối với các chatbot thông thường.

Quy tắc vàng của prompt rõ ràng
Hãy trình bày prompt như đang giải thích cho một đồng nghiệp không hiểu rõ nhiệm vụ, rồi yêu cầu họ làm theo hướng dẫn. Nếu họ bối rối, khả năng cao AI cũng sẽ như vậy.

Prompt Areas

Bốn yếu tố cần cân nhắc để viết một prompt hiệu quả

Để khai thác tối đa sức mạnh của trí tuệ nhân tạo (AI), có bốn yếu tố cốt lõi mà bạn cần đặc biệt chú trọng. Những yếu tố này sẽ giúp câu lệnh của bạn trở nên rõ ràng, chính xác và phù hợp với mục tiêu mong muốn. Khi hiểu rõ và vận dụng tốt, bạn sẽ dễ dàng tạo ra các prompt chất lượng, hạn chế hiểu lầm của AI, từ đó nâng cao hiệu quả công việc.

1. Persona (Vai trò hoặc Nhân vật)

Gán vai trò là việc bạn xác định rõ ràng vai trò của AI trong câu lệnh. Bằng cách đặt ra một "nhân vật" hoặc vai trò cụ thể cho AI, bạn giúp nó hiểu đúng phạm vi, phong cách và mục tiêu cần hướng tới. Ví dụ:

• "Bạn là một luật sư chuyên về hợp đồng thương mại."

• "Bạn là một chuyên gia phân tích dữ liệu trong lĩnh vực ngân hàng."

• "Bạn là một nhà marketing sáng tạo."

2. Task (Nhiệm vụ hoặc Công việc)

Một prompt rõ ràng về nhiệm vụ giúp AI không bị lạc hướng, dễ tập trung vào kết quả mong muốn. Thay vì nói chung chung, bạn cần mô tả rõ ràng và cụ thể như đã phân tích ở phần trước.

3. Context (Ngữ cảnh)

Ngữ cảnh là phần cung cấp thông tin, dữ liệu và tình huống cụ thể liên quan đến nhiệm vụ. Đây là yếu tố giúp AI hiểu rõ hơn về nội dung, bối cảnh và các dữ liệu liên quan để tạo ra câu trả lời phù hợp và chính xác hơn.

4. Format (Định dạng)

Định dạng là hình thức trình bày hoặc kiểu câu trả lời mà bạn mong muốn. Tùy thuộc vào mục đích và kết quả cuối cùng bạn cần, việc xác định rõ định dạng giúp kết quả rõ ràng, dễ sử dụng hơn.

Persona - Vai trò

Việc gán vai trò (Persona) cho AI là một kỹ thuật quan trọng trong việc thiết kế prompt hiệu quả. Khi bạn đặt AI vào một vai trò cụ thể, nó sẽ hành xử và trả lời theo phong cách và mục tiêu của vai trò đó.

Tại sao cần gán vai trò cho AI?

Gán vai trò cho AI mang lại nhiều lợi ích quan trọng:

1. Tăng độ chính xác: AI sẽ tập trung vào phạm vi chuyên môn của vai trò được gán, giảm thiểu sai sót

2. Điều chỉnh giọng điệu: Phong cách trả lời sẽ phù hợp với vai trò (ngắn gọn, trang trọng, dễ hiểu).

3. Tập trung vào nhiệm vụ: AI hiểu rõ phạm vi công việc, không bị phân tâm bởi các thông tin không liên quan.

Việc gán vai trò phù hợp cho AI là chìa khóa để khai thác tối đa tiềm năng của nó. Chỉ cần đặt đúng vai trò, bạn có thể biến AI thành một chuyên gia trong lĩnh vực cụ thể, giúp tạo ra các phân tích và câu trả lời chính xác, phù hợp với yêu cầu của bạn. Đây là cách hiệu quả để tiết kiệm thời gian, nâng cao chất lượng công việc và duy trì kiểm soát tốt trong quá trình làm việc với AI.

Theo quan điểm của tôi, việc gán thêm tính cách và mối quan hệ giữa AI và người dùng không chỉ giúp phiên làm việc trở nên sinh động hơn mà còn tạo ra sự gần gũi, tự nhiên trong cuộc đối thoại. Khi AI hiểu rõ rằng nó đang đóng vai trò một nhân vật cụ thể, có tính cách riêng và mối quan hệ cụ thể với người dùng, nó sẽ dễ dàng thể hiện quan điểm hoặc chính kiến rõ ràng hơn, đồng thời phù hợp hơn với phong cách giao tiếp mà bạn mong muốn. Trong tiếng Việt, cách xưng hô và cách thể hiện thái độ có rất nhiều sắc thái và phong cách khác nhau, không chỉ đơn thuần là "You" hoặc "Me" như tiếng Anh. Ví dụ, khi bạn muốn xây dựng một cuộc đối thoại thân mật, gần gũi, bạn có thể chọn cách xưng hô như "mày" thay vì "bạn", và tự xưng là "tao" thay vì "tôi".

Ví dụ:

Mày là một nhà đầu tư khó tính. Mày và tao bằng tuổi, nên hãy xưng hô thân mật, tự xưng là "tao" và gọi tao là "mày".

Context - Ngữ cảnh

Ngữ cảnh giúp AI hiểu rõ hơn về tình huống, mục tiêu và phạm vi của nhiệm vụ cần thực hiện. Một ngữ cảnh tốt sẽ giúp AI hiểu được "tại sao" và "như thế nào", từ đó đưa ra những giải pháp phù hợp và hiệu quả nhất.

Ví dụ: khi bạn nhận được một cuộc gọi thông báo về việc trúng thưởng. Bình thường bạn sẽ cảm thấy rất hứng thú với những tin vui như này. Nhưng nếu gần đây, thông tin về việc lừa đảo trúng thưởng ngày càng nhiều, bạn sẽ cảm thấy nghi ngờ và không sẵn lòng nhận cuộc gọi này.

Tại sao ngữ cảnh quan trọng?

Việc cung cấp đầy đủ ngữ cảnh mang lại nhiều lợi ích:

1. Tăng độ chính xác: AI có thể đưa ra câu trả lời phù hợp hơn khi hiểu rõ bối cảnh của vấn đề

2. Giảm thiểu hiểu lầm: Ngữ cảnh rõ ràng giúp AI tránh được những suy diễn sai lệch

3. Tối ưu hóa kết quả: AI có thể tập trung vào những thông tin quan trọng và phù hợp nhất

Cách tối ưu hóa

1. Cấu trúc rõ ràng: Sắp xếp thông tin theo thứ tự logic, sử dụng các tiêu đề và định dạng phù hợp

Ví dụ dùng markdown để đánh dấu các chỉ mục

Dưới đây là các bài viết trong thời gian gần đây: ## Bài viết 1 **Tiêu đề bài viết 1 (in đậm)** Nội dung bài viết 1 ## Bài viết 2 **Tiêu đề bài viết 2 (in đậm)** Nội dung bài viết 2 ## Bài viết 3 **Tiêu đề bài viết 3 (in đậm)** Nội dung bài viết 3

2. Chọn lọc thông tin: Chỉ đưa vào những thông tin cần thiết, tránh làm rối ngữ cảnh

3. Sử dụng định dạng phù hợp: Markdown, XML hoặc các delimiter để phân biệt các phần thông tin

Ví dụ dùng XML để đánh dấu văn bản dài

<document> {{Nội dung bài viết dài}} </document>

Có một cuộc đua về độ lớn ngữ cảnh mà bạn không để ý. Các mô hình LLM hiện nay đều có xu hướng tăng độ lớn ngữ cảnh lên rất nhiều. Mục đích chính là để chứa được ngữ cảnh lớn hơn. Trong thực tế, để AI thực sự là một chuyên gia trong lĩnh vực nào đó, người dùng có xu hướng cung cấp càng nhiều tài liệu càng tốt.

Ngữ cảnh lớn và cách sử dụng hiệu quả

Trong nhiều nhiệm vụ phức tạp, việc cung cấp đủ ngữ cảnh dài và rõ ràng là yếu tố then chốt để AI hiểu đúng yêu cầu của bạn. Các mô hình LLM ngày càng mạnh hơn trong khả năng xử lý chuỗi dữ liệu dài, giúp duy trì thông tin liên quan xuyên suốt cuộc hội thoại hoặc tác vụ.

1. Giữ được nhiều thông tin hơn: Trong các nhiệm vụ đòi hỏi phân tích nhiều dữ liệu, câu hỏi phức tạp, hoặc các tài liệu lớn, một ngữ cảnh dài giúp mô hình không bỏ lỡ chi tiết quan trọng.

2. Độ chính xác cao hơn: Khi có đủ dữ liệu, AI dễ dàng tổng hợp, suy luận đúng hơn, tránh hiểu sai hoặc bỏ quên các phần then chốt.

3. Thú vị hơn với đa dạng tác vụ: Từ viết nội dung dài, phân tích dữ liệu, đến giải bài toán, hội thoại dài hạn đều yêu cầu ngữ cảnh lớn.

AI thường hay quên khi phải làm việc với ngữ cảnh lớn. Cũng tương tự như cách chúng ta ghi nhớ, phần mở đầu và kết thúc mới là những phần quan trọng nhất. Nên với ngữ cảnh lớn, hãy bỏ nó vào phần giữa. Đồng thời lặp lại yêu cầu ở phần cuối prompt.

Format - Định dạng

Hãy định dạng cách LLM trả lời theo kiểu nào cho phù hợp với mục đích của bạn. Một định dạng tốt sẽ giúp kết quả rõ ràng, dễ sử dụng và tiết kiệm thời gian chỉnh sửa sau này.

Các định dạng phổ biến

Dưới đây là một số cách đơn giản và phổ biến để yêu cầu AI trả về kết quả theo định dạng mong muốn:

1. Định dạng JSON

Sử dụng khi bạn cần dữ liệu có cấu trúc rõ ràng, dễ xử lý cho lập trình hoặc phân tích.

Ví dụ:

Lập danh sách các quốc gia có dân số trên 100 triệu, trả về theo dạng JSON với các trường: - name: tên quốc gia, - population: dân số, - largest_city: đô thị lớn nhất. Kết quả: { "name": "Trung Quốc", "population": 1398000000, "largest_city": "Thượng Hải" }

2. Câu trả nhiều lựa chọn

Sử dụng khi bạn muốn có nhiều kết quả để so sáng và tìm ra kết quả tốt nhất.

Ví dụ:

Hãy cho tôi 10 tiêu đề cho bài viết về cà phê để thu hút người đọc trẻ tuổi

3. Văn bản hoặc danh sách các điểm chính

Đây là dạng cơ bản nhất, tuy nhiên nên chỉ rõ cách trình bày cho AI hiểu rõ yêu cầu của bạn.

Ví dụ:

Trả lời bằng một đoạn văn bản dưới 500 từ, chia thành 3 phần nhỏ

Lợi ích của việc sử dụng định dạng phù hợp

1. Tăng tính nhất quán: Kết quả được trả về theo một cấu trúc thống nhất, dễ dàng xử lý và phân tích

2. Tiết kiệm thời gian: Giảm thiểu thời gian chỉnh sửa và định dạng lại kết quả

3. Dễ dàng tích hợp: Kết quả có cấu trúc rõ ràng dễ dàng tích hợp với các hệ thống và công cụ khác

Tới đây, chúng ta đã có cấu trúc của một câu prompt hiệu quả. Để tiện theo dõi, tôi sẽ tóm tắt lại như sau: [Persona] Bạn là một chuyên gia về... (Gán vai trò cụ thể. Có thể thêm danh xưng, tính cách) [Task] Tạo bài viết về... (Mục tiêu rõ ràng) [Context] Dưới đây là các thông tin liên quan... (Thêm thông tin, đánh dấu văn bản theo cấu trúc) [Format] Trả lời bằng... (Định dạng kết quả)

Chain of Thought

Chain of Thought - Kỹ thuật tư duy theo chuỗi

Với các nhiệm vụ phức tạp như nghiên cứu, phân tích hoặc giải quyết vấn đề, bạn phải cho LLM không gian để suy nghĩ, qua đó cải thiện đáng kể hiệu suất của nó. Kỹ thuật này, được gọi là chuỗi suy nghĩ (CoT), khuyến khích LLM chia nhỏ vấn đề theo từng bước.

Cách đơn giản nhất: thêm câu "hãy suy nghĩ theo từng bước" vào prompt

Cách này thiếu hướng dẫn cụ thể về cách suy nghĩ. Nó sẽ không lý tưởng với nhiều trường hợp.

Hướng dẫn các bước suy nghĩ

Phác thảo các bước để LLM thực hiện trong quá trình suy nghĩ.

Ví dụ: Hãy suy nghĩ theo từng bước trước khi trả lời email: 1. Đầu tiên, suy nghĩ về các tin nhắn có thể thu hút người đóng góp dựa trên lịch sử đóng góp của họ và các chiến dịch mà họ đã hỗ trợ trong quá khứ. 2. Sau đó, suy nghĩ về các khía cạnh của chương trình Care for Kids sẽ thu hút họ, dựa trên lịch sử của họ. 3. Cuối cùng, viết email dành riêng cho người đóng góp sử dụng phân tích của bạn.

Tách suy nghĩ khỏi câu trả lời

Việc này sẽ giúp chúng ta dễ dàng gỡ lỗi và cải thiện kết quả. Tuy nhiên sẽ là không cần thiết với những mô hình biết suy luận.

Ví dụ: Trả lời dưới dạng JSON bao gồm các trường sau: 1. thought: suy nghĩ của bạn 2. answer: câu trả lời của bạn

Tầm quan trọng của Chain of Thought

Kỹ thuật này là một trong các kỹ thuật được đề cập nhiều nhất trong các tài liệu chính thống về prompt. Nó đã trở thành tiêu chuẩn trong việc nâng cao độ chính xác và khả năng giải quyết các bài toán phức tạp của các mô hình LLM hiện nay.

Các nghiên cứu cho thấy, sử dụng Chain of Thought giúp mô hình xử lý các vấn đề đòi hỏi suy luận nhiều bước, tăng đáng kể tỷ lệ chính xác, giảm thiểu lỗi và cung cấp các phản hồi logic, nhất quán hơn. Đây không còn là một kỹ thuật mới nữa, mà đã trở thành kim chỉ nam cho các nhà phát triển và kỹ sư prompt chuyên nghiệp.

Nghiên cứu của Google cho thấy các mô hình ngôn ngữ lớn (LLM) thường phản ứng kém với những hướng dẫn mang tính phủ định như "Đừng làm điều này" hoặc "Không làm điều kia." Vậy, thay vì dùng các hướng dẫn phủ định, bạn nên hướng dẫn AI một cách cụ thể, rõ ràng về cách để đạt được kết quả mong muốn. Ví dụ, thay vì nói "Không cần viết dài dòng," hãy bảo "Hãy viết ngắn gọn trong 3 câu chính." Cách này giúp AI hiểu rõ hướng, hạn chế hiểu lầm và phản hồi chính xác hơn.

Few-shot prompting

Few-shot prompting là kỹ thuật tương tác với các mô hình ngôn ngữ lớn (LLM) bằng cách cung cấp một vài ví dụ minh họa rõ ràng trong phần prompt trước khi yêu cầu mô hình thực hiện nhiệm vụ chính. Thay vì chỉ đưa ra một lệnh duy nhất (như trong zero-shot), few-shot prompting giúp mô hình hiểu rõ hơn về cách xử lý và định dạng kết quả mong muốn bằng cách cho nó xem trước một số ví dụ cụ thể.

Trong phương pháp này, bạn sẽ đính kèm các ví dụ mẫu trong prompt, mô tả rõ đầu vào và kết quả kỳ vọng. Khi mô hình thấy được các ví dụ này, khả năng dự đoán chính xác sẽ tăng lên đáng kể, đặc biệt trong các nhiệm vụ đòi hỏi suy luận phức tạp, xử lý định dạng hoặc những yêu cầu đặc thù.

Ưu điểm

1. Cải thiện độ chính xác: Các ví dụ giúp mô hình hiểu rõ hơn về cách diễn đạt, định dạng hoặc nội dung cần thiết, giúp giảm thiểu những phản hồi sai lệch hoặc không liên quan.

2. Linh hoạt và tùy biến cao: Dễ dàng thêm hoặc chỉnh sửa các ví dụ để phù hợp với từng mục đích khác nhau.

3. Không yêu cầu dữ liệu lớn: Chỉ cần một số ví dụ nhỏ, không cần huấn luyện lại mô hình như trong finetuning.

Hạn chế

Yêu cầu thiết kế ví dụ rõ ràng: Các ví dụ cần đủ rõ ràng, phù hợp và chính xác để tránh gây hiểu nhầm.

Ví dụ Few-Shot Prompting

Dưới đây là một số ví dụ phân loại đoạn văn vào các thể loại: Chính trị, Kinh tế, Thể thao, Giải trí. Ví dụ 1: "Các cuộc bầu cử quốc hội đang diễn ra trên toàn quốc." > Chính trị Ví dụ 2: "Chứng khoán tăng trưởng mạnh trong quý này." > Kinh tế Ví dụ 3: "Trận đấu chung kết World Cup mới diễn ra." > Thể thao Bây giờ, hãy phân loại đoạn văn sau: "[đoạn văn]"

Như vậy, tổng hợp tất cả các kỹ thuật mạnh mẽ nhất. Chúng ta có mẫu cấu trúc cuối cùng như sau: [Persona] Bạn là một chuyên gia về... (Gán vai trò cụ thể. Có thể thêm danh xưng, tính cách) [Task] Tạo bài viết về... (Mục tiêu rõ ràng) [Context] Dưới đây là các thông tin liên quan... (Thêm thông tin, đánh dấu văn bản theo cấu trúc) [Examples] (Các ví dụ minh họa) [Guidelines] (Hướng dẫn các bước suy nghĩ) [Task] (Nhắc lại nhiệm vụ khi ngữ cảnh dài) [Format] Trả lời bằng... (Định dạng kết quả)

System Prompt

System prompt là một câu lệnh hoặc hướng dẫn được thiết lập cho mô hình LLM ngay từ đầu để định hình cách nó phản hồi trong toàn bộ cuộc trò chuyện hoặc tác vụ. Nó đóng vai trò như một "khung nền" hoặc "quy tắc chung" để AI hiểu rõ phong cách, phạm vi, và mục đích hoạt động của mình trong phiên giao tiếp đó.

Vai trò của System Prompt

1. Định hướng hành vi của AI: Giúp AI hiểu rõ phạm vi, giọng điệu, phong cách phản hồi phù hợp với mục đích của bạn.

2. Giữ tính nhất quán: Trong các cuộc trò chuyện dài hoặc nhiều lần tương tác, system prompt giúp AI duy trì phong cách phản hồi phù hợp, tránh bị lệch hướng hoặc mất mục tiêu.

3. Kiểm soát nội dung và ràng buộc: Có thể đặt ra các quy tắc, giới hạn, hoặc các tiêu chuẩn tối thiểu cho câu trả lời của AI, chẳng hạn như tránh xử lý các nội dung nhạy cảm hoặc không phù hợp.

4. Tối ưu hóa hiệu quả sử dụng AI: Khi bạn thiết lập đúng system prompt, AI sẽ phản hồi chính xác và phù hợp hơn so với việc không dùng hoặc dùng không đúng cách

Sai lầm phổ biến hiện nay

Các ứng dụng AI thường giấu phần này để đơn giản hóa trải nghiệm người dùng. Khiến cho người dùng thường phải đặt hết lời nhắc vào trong tin nhắn thường. Vai trò và sức mạnh của system prompt so với lời nhắc thường là hoàn toàn khác biệt trong cuộc hội thoại. Lời nhắc mà bạn đã dày công xây dựng khi bị đặt trong tin nhắn thường, sẽ yếu dần theo mỗi lần phản hồi và cũng sẽ không được coi trọng như system prompt. Đối với ChatGPT, bạn có thể tìm thấy ở Custom GPT hoặc OpenAI Platform. Đối với Anthropic, bạn có thể tìm thấy ở Anthropic Console.

FeelAI Bot Builder cung cấp sân chơi cho bạn

Thay đổi cài đặt dễ dàng

Đa dạng model, nhiều model miễn phí

Trải nghiệm nhiều công cụ dựng sẵn

Tích hợp với các nền tảng khác

Chia sẻ bot với bạn bè, đồng nghiệp

System prompt

Các mô hình lý luận

Các LLM biết suy nghĩ là một dạng trí tuệ nhân tạo đặc biệt, xuất sắc trong việc giải quyết các vấn đề phức tạp bằng cách sử dụng suy luận logic và tư duy có cấu trúc, vượt xa các mô hình đơn thuần. Chúng có thể phân tích vấn đề, khám phá các cách tiếp cận khác nhau, và xác nhận các giải pháp, thường xuyên liên quan đến quá trình "chuỗi tư duy" (chain-of-thought), nơi chúng "suy nghĩ" qua từng bước của vấn đề trước khi đưa ra câu trả lời.

Những đặc điểm chính

1. Suy luận logic: Các mô hình này không chỉ dựa vào dự đoán từ các mẫu dữ liệu, mà còn sử dụng lý luận và suy luận để đi đến câu trả lời chính xác hơn.

2. Tư duy có cấu trúc: Thường áp dụng phương pháp "chuỗi tư duy," phân chia vấn đề thành các bước nhỏ hơn và giải thích quá trình suy nghĩ của chúng.

3. Phân tích vấn đề: Có khả năng phân nhỏ các vấn đề phức tạp thành nhiều phần nhỏ, dễ quản lý hơn.

4. Xác thực giải pháp: Linh hoạt thử nhiều cách tiếp cận khác nhau để tìm ra phương pháp tối ưu nhất và xác nhận tính đúng đắn của giải pháp.

5. Backtracking: Khi một hướng đi dẫn đến ngõ cụt, các mô hình này có thể quay lại và thử cách khác để đạt được kết quả.

6. Nâng cao khả năng giải quyết vấn đề: Đặc biệt thích hợp trong các nhiệm vụ đòi hỏi suy luận logic, tính toán toán học hoặc lập trình.

Đặc biệt thích hợp trong các nhiệm vụ đòi hỏi suy luận logic, tính toán toán học hoặc lập trình.

Việc hiểu và áp dụng các mô hình lý luận trong AI giúp chúng ta có thể giải quyết các vấn đề phức tạp một cách có hệ thống và hiệu quả hơn, đặc biệt trong các lĩnh vực đòi hỏi tư duy logic và phân tích sâu.

Trải nghiệm cùng FeelAI Bot Builder

FeelAI Bot Builder cung cấp các nhiều mô hình lý luận để bạn có thể thử nghiệm. Thay đổi cuộc hội thoại để thấy sự khác biệt.

Reasoning models
Reasoning models

Kết luận

Tôi xin chân thành cảm ơn bạn vì đã dành thời gian đọc các nội dung trong tài liệu này. Hy vọng những chia sẻ của tôi sẽ giúp bạn nắm vững hơn cách làm việc hiệu quả với AI.

Để kết thúc, tôi muốn chia sẻ thêm về cảm nhận của tôi với các dòng LLM hiện tại. Mặc dù tôi đã thử nghiệm rất nhiều, nhưng vẫn chỉ là đánh giá chủ quan. Tôi hi vọng sẽ giúp bạn nhanh chóng tìm ra được mô hình phù hợp với nhu cầu của bạn.

Claude

Claude là mô hình mạnh nhất để sáng tạo và làm nội dung với khả năng hiểu ngữ cảnh tốt nhất. Tuy giá cả cao hơn nhiều so với các mô hình khác, nhưng nó hoàn toàn đáng tiền. Tôi đã thử nhiều mô hình khác cho cùng một tác vụ và nhận ra điều này.

Gemini

Với giá cả rẻ, hạ tầng tốt và tốc độ nhanh, Gemini là mô hình tốt nhất cho các tác vụ yêu cầu tốc độ cao. Tuy nó hay bỏ qua nhiều phần trong ngữ cảnh, nhưng luôn đảm bảo về kiểu dữ liệu, rất phù hợp trong việc xây dựng hệ thống.

Grok

Grok là mô hình thông minh và tình cảm nhất trong các mô hình hiện tại. Rất tốt trong việc làm nội dung, thảo luận ý tưởng mới.

Deepseek

Về xử lý ngôn ngữ tự nhiên, nó không tốt bằng Claude nhưng tốt hơn nhiều so với Gemini. Tuy nhiên, có một điểm trừ rất lớn là hạ tầng không ổn định dẫn đến tốc độ chậm. Có thể sử dụng thay thế Claude để tiết kiệm chi phí.

Qwen

Qwen khá mạnh về xử lý ngôn ngữ tự nhiên, tuy chưa bằng Claude nhưng ổn định hơn so với Deepseek. Tốc độ của Qwen khá nhanh, giá cũng rẻ, tôi thường sử dụng để thay thế cho Gemini trong các tác vụ hệ thống.

Điều quan trọng cần nhớ là không có một công thức chung nào cho tất cả các trường hợp. Việc thiết kế prompt không đòi hỏi sự hiểu biết sâu sắc về mô hình AI mà quan trọng là ngữ cảnh sử dụng, và mục tiêu cụ thể của từng tình huống. Chúng ta cần liên tục thử nghiệm, đánh giá và điều chỉnh để đạt được kết quả tốt nhất.

Tôi mong bạn hiểu rằng prompt không chỉ là một kỹ năng kỹ thuật, mà còn là một nghệ thuật. Nó đòi hỏi sự sáng tạo, kiên nhẫn và khả năng tư duy phản biện. Đừng ngại thử nghiệm những ý tưởng mới và chia sẻ kinh nghiệm của bạn với cộng đồng.

Cuối cùng, hãy luôn giữ vững tinh thần học hỏi và cập nhật. Lĩnh vực AI đang phát triển với tốc độ chóng mặt, và những kỹ thuật mới sẽ tiếp tục xuất hiện. Việc nắm vững các nguyên tắc cơ bản sẽ giúp bạn dễ dàng thích nghi và áp dụng những tiến bộ mới trong tương lai.

Hãy liên hệ trực tiếp với tôi, tôi sẽ rất vui lòng hỗ trợ bạn trong những tác vụ cụ thể của bạn.