Sự phát triển của AI đã cho phép phát triển các mô hình ngôn ngữ lớn phức tạp có khả năng tiếp nhận và cung cấp một lượng lớn thông tin chi tiết cho người dùng. Các công cụ AI, chẳng hạn như ChatGPT và các hệ thống AI tổng quát khác, đã và đang thay đổi cách mọi người làm việc, học tập và tìm kiếm thông tin.
Nhưng cũng giống như con người, việc tìm kiếm câu trả lời có ý nghĩa nhất từ AI liên quan đến việc đặt câu hỏi đúng. AI không phải là tâm linh hay thần giao cách cảm. Nó không thể trực giác, nghĩa là nó không biết người dùng muốn gì cho đến khi nó được nêu rõ ràng. Ngoài ra, nó không thể cung cấp chi tiết cụ thể cho đến khi người dùng cung cấp các thông số chính xác cho câu hỏi. Một hệ thống AI phải được khuyến khích hoặc nhắc nhở để cung cấp đầu ra mong muốn. Điều này đạt được bằng cách thêm các chi tiết có thể hành động vào câu hỏi của người dùng.
Khi AI tiếp tục phát triển và thể hiện giá trị trong nỗ lực của con người, ngày càng có nhiều nhu cầu về các chuyên gia hiểu cách nhắc (đặt câu hỏi hoặc hành động cho) AI theo những cách hiệu quả và hiệu quả nhất có thể. Điều này đã dẫn đến sự xuất hiện của các công việc kỹ thuật AI Prompt như một vai trò của khoa học máy tính và thậm chí là một con đường sự nghiệp khả thi.
Kỹ thuật Prompt là gì?
Theo nghĩa rộng nhất, kỹ thuật prompt là nghệ thuật tìm ra cách đặt những câu hỏi hay nhất để gợi ra những câu trả lời có ý nghĩa nhất từ AI. Điều này thường liên quan đến các kỹ năng ngôn ngữ tốt để sử dụng danh từ, động từ và nghệ thuật từ vựng khác để truy vấn AI.
Mặc dù bất kỳ người dùng AI sáng tạo nào cũng sẽ thực hiện hiệu quả một số tác vụ được yêu cầu từ một kỹ sư Prompt bằng cách chỉ cần đặt câu hỏi cho AI, kỹ sư này sẽ nghiên cứu kỹ các sắc thái của đầu vào ngôn ngữ và quan sát cách đầu ra của AI phản hồi. Điều này cho phép kỹ sư nhanh chóng giúp tinh chỉnh sự phát triển của mô hình ngôn ngữ lớn ( LLM ) và tìm kiếm các hạn chế, lỗi và khiếm khuyết của AI mà các nhà phát triển AI có thể giải quyết. Các kỹ sư nhắc nhở cũng có thể làm việc để đào tạo AI bằng cách giúp nó hiểu cách diễn giải và xử lý các lời nhắc khác nhau. Do đó, vai trò của kỹ sư Prompt được mô tả là sự kết hợp giữa lập trình, hướng dẫn và giảng dạy.
Để hiểu tầm quan trọng của lời nhắc, hãy xem xét ví dụ đơn giản về việc người dùng truy vấn AI về một chủ đề đơn giản trong thế giới thực, chẳng hạn như giải thưởng trong ngành giải trí. Một người dùng hỏi câu hỏi sau:
"Ai đoạt giải điện ảnh?"
Đây là một lời nhắc không hiệu quả vì nó quá rộng. AI có thể phản hồi bằng cách trả lại mọi người chiến thắng mọi giải thưởng liên quan đến phim cho mỗi năm khi có sẵn dữ liệu. Đó sẽ là một danh sách không thể quản lý mà người dùng sẽ cần phải phân tích thủ công.
Tuy nhiên, người dùng có thể hỏi một câu hỏi cụ thể hơn, chẳng hạn như sau:
"Bộ phim nào đã giành giải Oscar cho Phim hay nhất năm 2019?"
AI với dữ liệu đầy đủ và được đào tạo có thể phản hồi hiệu quả bằng một câu trả lời cụ thể. Trong trường hợp này, bộ phim Green Book đã giành giải Oscar cho Phim hay nhất năm 2019.
Kỹ sư nhắc nhở phải biết rằng câu trả lời của AI cho các câu hỏi là chính xác. Nếu kết quả không có, không đầy đủ, không thể đoán trước hoặc ngoài ý muốn, kỹ sư nhanh chóng có thể đào tạo AI để nó biết câu trả lời chính xác -- hoặc báo cáo sự cố cho nhóm phát triển để khắc phục.
Đối với ví dụ về Giải thưởng Viện hàn lâm, một kỹ sư nhanh chóng có thể kiểm tra AI bằng cách đặt câu hỏi sau:
"Bộ phim nào đã giành giải Oscar cho Phim hay nhất năm 1917?"
Kể từ khi lễ trao giải Oscar đầu tiên được tổ chức vào năm 1929, kỹ sư nhanh chóng sẽ đặc biệt chú ý đến cách AI phản hồi và những lời giải thích mà nó có thể đưa ra. Điều này là do chắc chắn không có dữ liệu để đáp ứng truy vấn vì Giải thưởng Học viện không tồn tại vào năm 1917.
Một kỹ sư Prompt làm gì?
Từ góc độ việc làm, kỹ thuật prompt là một hình thức trừu tượng của kỹ thuật giao diện người dùng . Ví dụ: một kỹ sư giao diện người dùng truyền thống chịu trách nhiệm đảm bảo rằng giao diện người dùng được thiết kế trực quan, dễ điều hướng và cung cấp các phản hồi hoặc hành vi rõ ràng cho người dùng. AI sáng tạo đặt ra những thách thức về giao diện người dùng khác nhau vì người dùng chỉ cần hỏi AI về những gì họ muốn. Bản thân giao diện người dùng là cơ chế nhắc cho các mô hình ngôn ngữ lớn như GPT. Kỹ sư nhắc nhở phải hiểu cách thức hoạt động của AI, nhận ra cách AI sẽ phản hồi với các lời nhắc cụ thể và đảm bảo rằng AI sẽ cung cấp đầu ra hoặc phản hồi có ý nghĩa cho bất kỳ lời nhắc đầu vào nào.
Kỹ sư prompt ngày nay phục vụ một vai trò liên ngành có ba thành phần chính sau:
Phát triển, thử nghiệm và tinh chỉnh lời nhắc AI
Vai trò cốt lõi của bất kỳ kỹ sư prompt nào là làm việc trực tiếp với các nền tảng AI để phát triển các lời nhắc mới. Họ kiểm tra các hành vi và kết quả đầu ra của AI từ những lời nhắc đó và làm việc để cải thiện các lời nhắc hoặc giúp áp đặt các biện pháp bảo vệ AI để duy trì đầu ra AI an toàn hoặc có thể dự đoán được khi đưa ra các lời nhắc mới hoặc bất ngờ.
Ví dụ: một kỹ sư prompt làm việc với một nền tảng AI cụ thể như AI chăm sóc sức khỏe có thể phát triển các lời nhắc để hỏi về chẩn đoán bệnh nhân và kiểm tra cách AI phản hồi khi đầu vào như tên bệnh nhân hoặc thuật ngữ y tế bị sai chính tả. Sau đó, họ có thể đưa ra đề xuất hoặc thay đổi để tinh chỉnh lời nhắc hoặc phản hồi AI có thể chấp nhận được. Trong nhiều trường hợp, các kỹ sư kịp thời có thể tham gia vào quá trình đào tạo và sàng lọc AI đang diễn ra.
Phối hợp với các nhóm liên ngành
Một kỹ sư prompt thường là một phần của nhóm phát triển, nhưng đóng vai trò tư vấn và kiểm soát chất lượng nhiều hơn. Kỹ sư prompt sẽ làm việc với các nhà phát triển trong nhóm sản phẩm thiết kế và mã hóa nền tảng AI. Họ cũng sẽ là một phần của nhóm dữ liệu, nhóm thiết lập bộ dữ liệu và đào tạo nền tảng AI, cũng như nhóm kinh doanh bao gồm các bên liên quan của dự án.
Một kỹ sư prompt thường được giao nhiệm vụ sắp xếp các lời nhắc phù hợp với mục tiêu của công ty và nhu cầu của người dùng. Đối với ví dụ về AI chăm sóc sức khỏe, một kỹ sư nhanh chóng có thể tập trung công việc vào các nhu cầu và kỳ vọng của bác sĩ và người chăm sóc khác từ AI, chẳng hạn như cách sử dụng các thuật ngữ y tế và kết quả là dữ liệu bệnh nhân và chẩn đoán được trình bày.
Phân tích và báo cáo
Cuối cùng, một kỹ sư prompt phải hiểu phân tích. Họ cần theo dõi và tương quan giữa đầu vào và đầu ra, đồng thời thiết lập các số liệu có ý nghĩa để đo lường các hành vi và hiệu suất của nền tảng AI. Những phân tích này hữu ích cho các nhà phát triển, nhà khoa học dữ liệu và nhóm kinh doanh.
GIGO (rác vào, rác ra) là một trong những tiên đề lâu đời nhất của khoa học máy tính, nhưng chưa bao giờ nó phù hợp hơn trong lĩnh vực AI. Ví dụ: một kỹ sư nhắc nhở có thể phân tích các phản hồi của AI đối với một số nhóm nhắc nhở nhất định và cảnh báo cho nhóm khoa học dữ liệu về các dấu hiệu sai lệch dữ liệu có thể cần đào tạo thêm hoặc xem xét nội dung dữ liệu. Tương tự như vậy, các phản hồi nhanh chóng của AI cho biết khoảng trống dữ liệu hoặc gây ra kết quả không thể đoán trước có thể báo hiệu nhu cầu xem xét dữ liệu và đào tạo bổ sung.
5 kỹ năng cần thiết để trở thành kỹ sư Prompt
Bộ kỹ năng cần thiết để đủ điều kiện cho một công việc kỹ sư prompt không dài, nhưng nó có thể rất rộng. Đây là điển hình cho các vai trò mới nổi vẫn đang được xác định bởi một ngành đang phát triển nhanh chóng. Các vai trò kỹ thuật nhanh hiện tại thường yêu cầu một bộ kỹ năng bao gồm năm yếu tố chính sau:
- Kỹ năng giao tiếp bằng lời nói và bằng văn bản mạnh mẽ. Không giống như nhiều vai trò CNTT, các kỹ sư prompt phải giao tiếp với các hệ thống AI thông qua các từ và cụm từ. Lời nhắc chi tiết có thể khá phức tạp và liên quan đến hàng trăm, thậm chí hàng nghìn từ được lựa chọn cẩn thận. Ngoài ra, bản chất liên ngành của các vai trò kỹ thuật nhanh chóng làm cho giao tiếp và cộng tác trở nên cực kỳ quan trọng.
- Trình độ lập trình. Mặc dù kỹ thuật nhắc nhở không chính xác là lập trình, nhưng các kỹ sư prompt thường tham gia vào việc mã hóa -- cho dù họ tham gia phát triển chính nền tảng AI hay sử dụng các kỹ năng lập trình để tự động hóa thử nghiệm và các chức năng khác. Điều này thường đòi hỏi nhiều năm kinh nghiệm đã được chứng minh với các ngôn ngữ được chấp nhận tốt như Python hoặc các ngôn ngữ tương tự. Nó cũng giúp có kiến thức vững chắc về API, hệ điều hành và CLI . Các yêu cầu chính xác sẽ phụ thuộc vào công ty và nền tảng AI.
- Kinh nghiệm nhắc trước. Cho rằng kỹ thuật prompt là một vai trò mới, thật khó để xác định mức độ kinh nghiệm tối thiểu trước đó, vì tiêu chuẩn truyền thống từ ba đến năm năm không áp dụng. Tuy nhiên, hầu hết các nhà tuyển dụng sẽ tìm kiếm các kỹ sư nhanh nhẹn có một số kinh nghiệm đã được chứng minh trong việc xây dựng và thử nghiệm các lời nhắc AI, cùng với kinh nghiệm làm việc với các mô hình chính như GPT và các nền tảng như ChatGPT .
- Kiến thức công nghệ AI. Các kỹ sư prompt dựa vào các kỹ năng ngôn ngữ, nhưng họ vẫn yêu cầu hiểu biết toàn diện về xử lý ngôn ngữ tự nhiên , LLM, học máy và một số lượng phát triển nội dung do AI tạo. Điều này đặc biệt quan trọng nếu kỹ sư nhanh chóng có bất kỳ sự tham gia trực tiếp nào vào mã hóa hoặc các trách nhiệm phát triển nền tảng AI khác.
- Kinh nghiệm phân tích dữ liệu. Các kỹ sư prompt phải hiểu dữ liệu được cung cấp cho nền tảng AI, dữ liệu được sử dụng trong lời nhắc và dữ liệu do AI tạo ra hoặc cung cấp để phản hồi. Điều này đòi hỏi kiến thức vững chắc về các kỹ thuật và công cụ phân tích dữ liệu. Ví dụ: một nhà tuyển dụng tiềm năng có thể tìm kiếm nhiều năm kinh nghiệm phân tích các nguồn dữ liệu có cấu trúc và phi cấu trúc. Kiến thức này có thể cần thiết khi tìm kiếm dữ liệu sai lệch hoặc dữ liệu không mong muốn khác và sẽ giúp hiểu một cách khách quan chất lượng của đầu ra AI.
Ngoài ra, các kỹ sư prompt sẽ yêu cầu các kỹ năng mềm , chẳng hạn như kỹ năng phân tích và giải quyết vấn đề xuất sắc, cùng với khả năng cộng tác hiệu quả với các nhóm đa chức năng. Mặc dù giáo dục chính quy và chứng chỉ chưa được phổ biến rộng rãi, nhưng nhiều nhà tuyển dụng sẽ tìm kiếm một số hình thức giáo dục chính quy truyền thống như bằng Cử nhân Khoa học Máy tính, Kỹ thuật hoặc lĩnh vực liên quan khác.
Tương lai của kỹ thuật Prompt
Tương lai của kỹ thuật prompt khó dự đoán, nhưng thật hợp lý khi kỳ vọng rằng kỹ thuật prompt sẽ tuân theo mô hình trưởng thành quen thuộc của ngành CNTT về đa dạng hóa, chuyên môn hóa và tiêu chuẩn hóa.
Ví dụ: AI thực tế hoặc thương mại như ChatGPT vẫn còn ở giai đoạn sơ khai và các LLM mới đang phát triển nhanh chóng. GPT-3.5 chỉ mới được thay thế bởi GPT-4 và Bing AI đã xuất hiện từ Microsoft. Các mô hình và nền tảng khác chắc chắn sẽ xuất hiện và đa dạng hóa trong những năm tới. Các kỹ sư nhanh chóng sẽ làm việc trong thời gian tới để hiểu và thành thạo từng mô hình.
Chẳng bao lâu nữa, có thể có quá nhiều mô hình để làm chủ và một số mô hình chính có thể sẽ chiếm ưu thế. Người ta có thể mong đợi rằng các kỹ sư kịp thời có thể phải đối mặt với một giai đoạn chuyên môn hóa trong đó phần lớn kinh nghiệm và kiến thức chuyên môn của họ chỉ tập trung vào một số mô hình có khả năng xuất hiện -- tương tự như cách mà các kiến trúc sư đám mây có thể tập trung vào AWS, Google hoặc Azure hơn là cố gắng thành thạo cả ba.
Nếu mô hình ngành quen thuộc này đúng với AI, thì các mô hình cuối cùng có thể trải qua một giai đoạn hợp nhất khi ngành thúc đẩy một số hình thức tiêu chuẩn hóa. Ngày nay, loại mô hình này có thể được nhìn thấy trong các sáng kiến đám mây như OpenStack, nơi các nhà lãnh đạo ngành bắt đầu cộng tác và sử dụng nguồn mở để tạo ra các cách thức hoạt động phổ biến và có thể tương tác hơn. Các nỗ lực tiêu chuẩn hóa khác có thể liên quan đến các hoạt động như chiến lược thử nghiệm AI và thậm chí là ổn định các công cụ tạo thử nghiệm của bên thứ ba. Mỗi bước trên đường đi sẽ thay đổi vai trò -- và nhu cầu -- đối với các kỹ sư prompt.