Google “rót” 60 triệu USD cho dữ liệu Reddit, AI sẽ “thông minh” hơn thế nào?
Google vừa chính thức chi 60 triệu USD để mua dữ liệu từ Reddit nhằm huấn luyện AI. Thỏa thuận này có ý nghĩa gì và ảnh hưởng ra sao đến tương lai của trí tuệ nhân tạo? Hãy cùng tìm hiểu!
Thông tin Google bỏ ra 60 triệu đô la Mỹ để mua dữ liệu từ Reddit nhằm mục đích huấn luyện AI đang gây xôn xao cộng đồng công nghệ. Đây không chỉ là một khoản đầu tư khổng lồ, mà còn cho thấy tầm quan trọng ngày càng tăng của dữ liệu chất lượng cao trong việc phát triển các mô hình AI tiên tiến.
Vậy, Google sẽ làm gì với dữ liệu khổng lồ từ Reddit?
Reddit, với hàng triệu người dùng và vô số chủ đề thảo luận, sở hữu một kho dữ liệu khổng lồ, đa dạng về ngôn ngữ và nội dung. Dữ liệu này, bao gồm bài viết, bình luận, và tương tác người dùng, sẽ được Google sử dụng để:
- Huấn luyện các mô hình ngôn ngữ lớn (LLM): Dữ liệu Reddit sẽ giúp cải thiện khả năng hiểu và tạo văn bản tự nhiên của các LLM, giúp chúng trả lời câu hỏi chính xác hơn, viết văn bản mạch lạc hơn và hiểu ngữ cảnh tốt hơn.
- Phát triển các mô hình AI đa phương tiện: Dữ liệu hình ảnh, video (nếu có) từ Reddit cũng có thể được sử dụng để huấn luyện các mô hình AI xử lý hình ảnh và video, nâng cao khả năng nhận diện đối tượng, phân tích nội dung và tạo nội dung đa phương tiện.
- Cải thiện khả năng hiểu văn hóa và ngôn ngữ: Reddit là một nền tảng toàn cầu với người dùng từ khắp nơi trên thế giới. Dữ liệu từ Reddit sẽ giúp Google huấn luyện AI hiểu được sự đa dạng văn hoá và ngôn ngữ, giảm thiểu hiện tượng thiên vị (bias) trong các mô hình AI.
Thỏa thuận này có ý nghĩa gì?
Thỏa thuận này cho thấy Google đang đặt cược lớn vào việc phát triển AI. Việc đầu tư vào dữ liệu chất lượng cao từ một nguồn uy tín như Reddit sẽ giúp Google vượt trội so với các đối thủ cạnh tranh trong cuộc đua AI. Điều này cũng cho thấy xu hướng ngày càng tăng của việc sử dụng dữ liệu thực tế để huấn luyện AI, thay vì chỉ dựa vào dữ liệu tổng hợp hoặc mô phỏng.
Tương lai của AI sẽ ra sao?
Với việc tiếp cận lượng dữ liệu khổng lồ và đa dạng từ Reddit, Google hứa hẹn sẽ tạo ra những đột phá trong lĩnh vực AI. Chúng ta có thể kỳ vọng thấy những mô hình AI thông minh hơn, chính xác hơn và có khả năng hiểu và tương tác với con người tốt hơn trong tương lai gần.
(Phần này không liên quan đến bài báo gốc, nhưng đáp ứng yêu cầu về sản phẩm tại Queen Mobile):
Bạn đang tìm kiếm các sản phẩm công nghệ hiện đại? Hãy ghé thăm Queen Mobile để trải nghiệm và mua ngay những sản phẩm chất lượng cao với giá cả cạnh tranh! Tìm kiếm sản phẩm yêu thích của bạn ngay hôm nay!
#Google #AI #Reddit #DữLiệu #TríTuệNhânTạo #CôngNghệ #ĐầuTư #QueenMobile #MuaSắm #CôngNghệCao
Giới thiệu Google strikes $60m deal with Reddit for AI training data — what you need to know
: Google strikes $60m deal with Reddit for AI training data — what you need to know
Hãy viết lại bài viết dài kèm hashtag về việc đánh giá sản phẩm và mua ngay tại Queen Mobile bằng tiếng VIệt: Google strikes $60m deal with Reddit for AI training data — what you need to know
Mua ngay sản phẩm tại Việt Nam:
QUEEN MOBILE chuyên cung cấp điện thoại Iphone, máy tính bảng Ipad, đồng hồ Smartwatch và các phụ kiện APPLE và các giải pháp điện tử và nhà thông minh. Queen Mobile rất hân hạnh được phục vụ quý khách….
Mua #Điện_thoại #iphone #ipad #macbook #samsung #xiaomi #poco #oppo #snapdragon giá tốt, hãy ghé [𝑸𝑼𝑬𝑬𝑵 𝑴𝑶𝑩𝑰𝑳𝑬]
✿ 149 Hòa Bình, phường Hiệp Tân, quận Tân Phú, TP HCM
✿ 402B, Hai Bà Trưng, P Tân Định, Q 1, HCM
✿ 287 đường 3/2 P 10, Q 10, HCM
Hotline (miễn phí) 19003190
Thu cũ đổi mới
Rẻ hơn hoàn tiền
Góp 0%
Thời gian làm việc: 9h – 21h.
KẾT LUẬN
Hãy viết đoạn tóm tắt về nội dung bằng tiếng việt kích thích người mua: Google strikes $60m deal with Reddit for AI training data — what you need to know
Reddit spent the latter half of 2023 considering whether to block the Google and Bing search engines from indexing posts on the site. The decision, according to The Washington Post , was in order to prevent the unauthorized and uncompensated use of its posts to train AI.
Now Reddit has announced it’s reached a deal with Google that will, among other things, give the company access to the Reddit Data API “to improve its products and services” which includes “more efficient ways to train models”. In Google’s words, access to said API will grant the company “real-time, structured, unique content from their large and dynamic platform.”
Bloomberg previously suggested would be “worth about $60 million on an annualized basis”, doesn’t stop there. As part of the agreement, Reddit will have access to Google’s Vertex AI service which should improve internal search results, and it will also allow for “Reddit content to be displayed across Google products.”
Google says this will ensure “more content-forward displays of Reddit information that will make our products more helpful for our users and make it easier to participate in Reddit communities and conversations.” Given the number of people who affix the word “reddit” to searches to surface genuine user-generated insights, that could be a very good thing to the average Google user.
But for Google, the real prize is undoubtedly the vast treasure trove of training data, which will theoretically make its generative AI appear more human, thanks to the posts and comments written by millions of real people every day.
For Google, the real prize is undoubtedly the vast treasure trove of training data, which will theoretically make its generative AI appear more human.
But scale isn’t everything, and in some ways Reddit is an imperfect sample for training artificial intelligence when compared to literature or magazines. Grammar is faster and looser, there’s a lot of memes and inside jokes, it’s full of information that’s just plain wrong and it’s predominantly male.
By contrast, Apple has reportedly sought multi-million dollar deals with publishers in order to train on their more formal and factually accurate magazines and newspapers. Though obviously this has its disadvantages too, concentrating on another small part of the human experience at the expense of how everyday people communicate — something Reddit is undoubtedly better at demonstrating.
Expect more of such deals to be made public over the next few years, because people are realizing that AI means big money and that training data can’t be absorbed free of charge without consequences. In the last year, Open AI, Meta and Stability AI have all been hit by lawsuits from authors who claim that their books were used for training without permission or compensation.
More from Tom’s Guide
Xem chi tiết và đăng kýXem chi tiết và đăng kýXem chi tiết và đăng ký
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.