GPT-3 là gì và tại sao nó lại thay đổi bộ mặt của trí tuệ nhân tạo?

Đã có rất nhiều sự nhiệt tình và cường điệu trong lĩnh vực trí tuệ nhân tạo (AI) xoay quanh một công nghệ được tạo ra gần đây có tên là GPT-3. Nói một cách đơn giản, nó là một AI vượt trội hơn tất cả mọi thứ đi trước nó ở việc tạo ra nội dung với cấu trúc ngôn ngữ - ngôn ngữ người hoặc ngôn ngữ máy.

GPT-3 được phát triển bởi OpenAI, một công ty nghiên cứu do Elon Musk đồng sáng lập và được mệnh danh là tiến bộ đáng kể và hữu dụng nhất trong trí tuệ nhân tạo trong nhiều năm.

Tuy nhiên, có một số nhầm lẫn về những gì nó làm (và quan trọng hơn là những gì nó không làm), vì vậy ở đây tôi sẽ cố gắng đơn giản hóa nó cho bất kỳ độc giả không chuyên về kỹ thuật nào quan tâm đến việc hiểu các nguyên tắc cốt lõi đằng sau nó. Tôi cũng sẽ thảo luận về một số vấn đề mà nó mang lại, cũng như lý do tại sao một số người tin rằng tầm quan trọng của nó đã bị thổi phồng phần nào.

Tín dụng hình ảnh: https://pixabay.com/photos/robot-mech-machine-technology-2301646

GPT-3 có khả năng gì?

GPT-3 có khả năng tạo ra bất cứ thứ gì có cấu trúc ngôn ngữ - điều này bao gồm trả lời câu hỏi, viết bài luận, tóm tắt các cuốn sách dài, dịch ngôn ngữ, ghi nhớ và thậm chí viết mã máy tính.

Thật vậy, trong một bài thuyết trình trực tuyến, nó được chứng minh cách tạo một ứng dụng có giao diện và hoạt động tương tự như ứng dụng Instagram bằng cách sử dụng plugin cho công cụ phần mềm được biết đến rộng rãi Figma.

Tất nhiên, điều này khá mới lạ, và nếu nó được chứng minh là có thể sử dụng và mang lại lợi ích về lâu dài, nó có thể gây ra những hậu quả sâu sắc cho sự phát triển phần mềm và ứng dụng trong tương lai.

Do mã này chưa được công bố rộng rãi (sau này sẽ nói thêm), quyền truy cập bị hạn chế đối với một nhóm nhà phát triển được chọn thông qua API do OpenAI quản lý. Kể từ khi API phát hành vào tháng XNUMX năm nay, các thể loại thơ, văn xuôi, báo cáo tin tức và tiểu thuyết sáng tạo đã xuất hiện.

Bài viết này đặc biệt thú vị vì nó cho thấy GPT-3 đang cố gắng - khá thuyết phục - để thuyết phục con người chúng ta rằng nó không gây hại. Mặc dù sự trung thực của robot của nó buộc nó phải thú nhận rằng "Tôi biết rằng tôi sẽ không thể tránh được việc hủy diệt nhân loại" nếu những kẻ ác đẩy nó đến!

GPT-3 hoạt động như thế nào?

GPT-3 là một mô hình dự đoán ngôn ngữ xét về nhiều loại ứng dụng AI. Điều này có nghĩa là nó là một khung thuật toán lấy một phần ngôn ngữ duy nhất (một đầu vào) và biến nó thành những gì mà thuật toán dự đoán sẽ là phần ngôn ngữ có lợi nhất cho người dùng.

Điều này có thể thực hiện được vì phân tích đào tạo mở rộng được thực hiện trên một lượng lớn tài liệu cần thiết để “đào tạo trước” nó. So với các thuật toán khác chưa được đào tạo, OpenAI đã sử dụng một lượng lớn tài nguyên máy tính cần thiết cho GPT-3 để hiểu cách ngôn ngữ hoạt động và được xây dựng. Theo OpenAI, thời gian tính toán cần thiết để thực hiện điều này tiêu tốn 4.6 triệu đô la.

Để tìm hiểu cách tạo các cấu trúc ngôn ngữ như câu, nó sử dụng phân tích ngữ nghĩa - không chỉ các từ và nghĩa của chúng, mà còn cả cách sử dụng các từ khác nhau tùy thuộc vào các từ khác trong văn bản.

Nó cũng được gọi là học tập không giám sát vì dữ liệu đào tạo không bao gồm bất kỳ thông tin nào về những gì tạo thành phản hồi “đúng” hoặc “sai”, như cách học có giám sát. Tất cả thông tin cần thiết để tính xác suất đầu ra đáp ứng các yêu cầu của người dùng đều được thu thập trực tiếp từ các văn bản đào tạo.

Điều này được thực hiện bằng cách phân tích cách sử dụng các từ và câu, sau đó tách chúng ra và cố gắng tái tạo lại chúng.

Ví dụ, các thuật toán có thể bắt gặp cụm từ “ngôi nhà có cánh cửa màu đỏ” trong quá trình đào tạo. Sau đó, nó lại được đưa ra cụm từ với một từ bị bỏ sót - ví dụ: “ngôi nhà có dấu X màu đỏ”.

Sau đó, nó sẽ kiểm tra văn bản trong dữ liệu đào tạo của nó - hàng trăm tỷ từ được sắp xếp theo ngôn ngữ có nghĩa - và chọn từ nào nên được sử dụng để tái tạo cụm từ gốc.

Để bắt đầu, gần như chắc chắn bạn sẽ làm sai - có thể hàng triệu lần. Tuy nhiên, cuối cùng nó sẽ đưa ra từ chính xác. Bằng cách so sánh kết quả với dữ liệu đầu vào ban đầu, nó xác định xem đầu ra có đúng hay không và “trọng số” được trao cho bước thuật toán tạo ra phản hồi chính xác. Điều này có nghĩa là nó “học” theo thời gian những chiến lược nào có nhiều khả năng tạo ra phản ứng thích hợp nhất trong tương lai.

Tầm quan trọng của quá trình “tính trọng số” động này là yếu tố phân biệt GPT-3 là mạng nơ-ron nhân tạo lớn nhất thế giới. Như đã được lưu ý, những gì nó đạt được không phải là mới lạ theo một số cách, vì các mô hình dự đoán ngôn ngữ biến thế đã tồn tại trong nhiều năm. Tuy nhiên, hệ thống tự động lưu trữ và sử dụng 175 tỷ trọng lượng để xử lý từng truy vấn - gấp mười lần so với đối thủ cạnh tranh gần nhất, do Nvidia xây dựng.

Hai AI nói về việc trở thành con người. (GPT-3)

Một số khó khăn liên quan đến GPT-3 là gì?

Khả năng tạo ngôn ngữ của GPT-3 được đánh giá là tốt nhất chưa từng thấy trong trí tuệ nhân tạo; tuy nhiên, có những điểm quan trọng nhất định cần xem xét.

Sam Altman, Giám đốc điều hành của OpenAI, tuyên bố, "Sự cường điệu về GPT-3 là quá mức." AI về cơ bản sẽ thay đổi thế giới, nhưng GPT-3 chỉ là một cái nhìn thoáng qua ”.

Để bắt đầu, nó là một công cụ cực kỳ đắt tiền để sử dụng vào thời điểm hiện tại, do lượng điện toán lớn cần thiết để thực hiện công việc của nó. Điều này có nghĩa là chi phí thực hiện nó sẽ cực kỳ tốn kém đối với các doanh nghiệp nhỏ hơn.

Hơn nữa, nó là một hệ thống đóng hoặc hộp đen. Bởi vì OpenAI chưa tiết lộ tất cả sự thật về cách các thuật toán của nó hoạt động, nên bất kỳ ai phụ thuộc vào nó để trả lời các truy vấn hoặc xây dựng các sản phẩm có giá trị sẽ không hoàn toàn chắc chắn về cách chúng được tạo ra.

Thứ ba, đầu ra của hệ thống chưa lý tưởng. Mặc dù nó có khả năng tạo ra các thông điệp ngắn gọn và phần mềm đơn giản, nhưng đầu ra của nó trở nên kém hữu ích hơn (thực sự, nó được mô tả là "vô nghĩa") khi được yêu cầu tạo ra thứ gì đó dài hơn hoặc phức tạp hơn.

Đây chắc chắn là những lo ngại sẽ được giải quyết theo thời gian - khi chi phí năng lượng tính toán tiếp tục giảm, tiêu chuẩn hóa xung quanh các nền tảng AI mở được xây dựng và các thuật toán được tinh chỉnh với khối lượng dữ liệu lớn hơn.

Nhìn chung, thật hợp lý khi kết luận rằng GPT-3 tạo ra những phát hiện đi trước nhiều năm ánh sáng so với những gì đã quan sát trước đây. Bất kỳ ai đã xem kết quả của ngôn ngữ AI đều hiểu chúng có thể thay đổi như thế nào và đầu ra của GPT-3 dường như đã đi trước một bước.

Khi chúng tôi thấy nó được đặt đúng cách trong tay công chúng và mọi người đều có thể tiếp cận được, thì hiệu suất của nó sẽ được cải thiện hơn nữa.

Cũng đọc: 

Jitendra Vaswani
Tác giả này được xác minh trên BloggersIdeas.com

Jitendra Vaswani là nhà tiếp thị kỹ thuật số hàng đầu được công nhận vì chuyên môn sâu rộng trong lĩnh vực này. Ông đã phát biểu tại các sự kiện quốc tế và thành lập Digiexe.com, một cơ quan tiếp thị kỹ thuật số và Bytegain.com, một công cụ dành cho SEO copywriting và SEO địa phương. Với hơn mười năm kinh nghiệm, Vaswani đã tạo ra những tác động đáng kể trong lĩnh vực tiếp thị kỹ thuật số. Ông cũng là tác giả cuốn sách 'Inside A Hustler's Brain: In Pursuit of Financial Freedom', cuốn sách đã bán được hơn 20,000 bản trên toàn thế giới và được quốc tế ca ngợi. Công việc của ông tiếp tục truyền cảm hứng cho nhiều người trong thế giới tiếp thị kỹ thuật số.

Tiết lộ chi nhánh: Hoàn toàn minh bạch - một số liên kết trên trang web của chúng tôi là liên kết liên kết, nếu bạn sử dụng chúng để mua hàng, chúng tôi sẽ kiếm được hoa hồng miễn phí cho bạn (không tính thêm phí gì!).

Để lại một bình luận