Why are people starting to sound like ChatGPT?



Why are people starting to sound like ChatGPT?

00:04

EN: How sure are you that you can tell what's real online?

VI: Bạn chắc chắn đến mức nào rằng mình có thể phân biệt được đâu là thật trên mạng?


00:08 – 00:09

EN: (Laughter)

VI: (Tiếng cười)


00:09 – 00:33

EN: You might think it's easy to spot an obviously AI-generated image, and you're probably aware that algorithms are biased in some way. But all the evidence is suggesting that we're pretty bad at understanding that on a subconscious level. Take, for example, the growing perception gap in America. We keep over- and overestimating how extreme other people's political beliefs are, and this is only getting worse with social media, because algorithms show us the most extreme picture of reality.


VI: Bạn có thể nghĩ rằng việc nhận ra một hình ảnh do AI tạo ra là điều dễ dàng, và có lẽ bạn cũng biết rằng các thuật toán luôn có sự thiên lệch nhất định. Nhưng mọi bằng chứng đều cho thấy chúng ta khá kém trong việc nhận ra điều đó ở cấp độ tiềm thức. Lấy ví dụ như khoảng cách nhận thức ngày càng gia tăng ở Mỹ. Chúng ta liên tục đánh giá quá cao mức độ cực đoan trong quan điểm chính trị của người khác, và điều này càng trở nên tồi tệ hơn với mạng xã hội, bởi vì các thuật toán thường chỉ cho chúng ta thấy phiên bản cực đoan nhất của thực tế.


00:33 – 00:49

EN: As an etymologist and content creator, I always see controversial messages go more viral because they generate more engagement than a neutral perspective. But that means we all end up seeing this more extreme version of reality, and we're clearly starting to confuse that with actual reality.


VI: Với tư cách là một nhà từ nguyên học và người sáng tạo nội dung, tôi luôn thấy những thông điệp gây tranh cãi lan truyền mạnh hơn vì chúng tạo ra nhiều tương tác hơn so với các quan điểm trung lập. Nhưng điều đó có nghĩa là tất cả chúng ta đều đang nhìn thấy một phiên bản thực tế cực đoan hơn, và rõ ràng chúng ta bắt đầu nhầm lẫn nó với thực tế thật.


00:49 – 01:04

EN: The same thing is currently happening with AI chatbots, because you probably assume that ChatGPT is speaking English to you, except it's not speaking English, in the same way that the algorithm's not showing you reality. There are always distortions, depending on what goes into the model and how it's trained.


VI: Điều tương tự cũng đang xảy ra với các chatbot AI, bởi vì bạn có thể nghĩ rằng ChatGPT đang “nói tiếng Anh” với bạn, nhưng thực ra không phải vậy — cũng giống như cách mà thuật toán không cho bạn thấy thực tế. Luôn có sự méo mó, tùy thuộc vào dữ liệu đầu vào và cách mô hình được huấn luyện.


01:04 – 01:48

EN: Like we know that ChatGPT says “delve” at way higher rates than usual, possibly because OpenAI outsourced its training process to workers in Nigeria who do, actually, say, "delve" more frequently. Over time, though, that little linguistic overrepresentation got reinforced into the model even more than in the workers' own dialects. Now that's affecting everybody's language. Multiple studies have found that, since ChatGPT came out, people everywhere have been saying the word "delve" more in spontaneous spoken conversation. Essentially, we're subconsciously confusing the AI version of language with actual language. But that means that the real thing is, ironically, getting closer to the machine version of the thing. We're in a positive feedback loop with the AI representing reality, us thinking that's the real reality, and regurgitating it so the AI can be fed more of our data.


VI: Ví dụ, chúng ta biết rằng ChatGPT sử dụng từ “delve” với tần suất cao hơn bình thường, có thể vì OpenAI đã thuê ngoài quá trình huấn luyện cho các lao động ở Nigeria — những người thực sự sử dụng từ “delve” thường xuyên hơn. Theo thời gian, sự thiên lệch nhỏ về ngôn ngữ đó lại được củng cố trong mô hình, thậm chí còn mạnh hơn cả trong phương ngữ của chính những người đó. Và giờ đây, điều đó đang ảnh hưởng đến ngôn ngữ của tất cả mọi người. Nhiều nghiên cứu đã phát hiện rằng kể từ khi ChatGPT ra mắt, mọi người trên khắp nơi sử dụng từ “delve” nhiều hơn trong giao tiếp nói tự nhiên. Về cơ bản, chúng ta đang vô thức nhầm lẫn phiên bản ngôn ngữ của AI với ngôn ngữ thật. Nhưng điều đó cũng có nghĩa là, trớ trêu thay, thực tế lại đang dần tiến gần hơn đến phiên bản “máy móc” của nó. Chúng ta đang ở trong một vòng lặp phản hồi tích cực: AI mô phỏng thực tế, chúng ta tưởng đó là thực tế, rồi lặp lại nó, từ đó cung cấp thêm dữ liệu cho AI.


01:48 – 02:34

EN: You can also see this with the algorithm through words like "hyperpop," [not a] part of our cultural lexicon until Spotify noticed an emerging cluster of similar users in their algorithm. [When] they identified it and introduced a hyperpop playlist, however, the aesthetic was given a direction. Now people began to debate what did and did not qualify as hyperpop. The label and the playlist made the phenomenon more real by giving them something to identify with or against. And as more people identified with hyperpop, more musicians also started making hyperpop music. All the while, the cluster of similar listeners in the algorithm grew larger, and Spotify kept pushing it more, because these platforms want to amplify cultural trends to keep you on the app. But that means we also lose the distinction between a real trend and an artificially inflated trend.


VI: Bạn cũng có thể thấy điều này với các thuật toán qua những từ như “hyperpop” — vốn không phải là một phần trong vốn từ văn hóa của chúng ta cho đến khi Spotify nhận ra một nhóm người dùng có sở thích tương tự trong thuật toán của họ. Khi họ xác định được điều đó và tạo ra playlist hyperpop, phong cách này bắt đầu có định hướng rõ ràng. Giờ đây, mọi người bắt đầu tranh luận về việc cái gì được coi là hyperpop và cái gì không. Chính cái tên và playlist đã khiến hiện tượng này trở nên “thật” hơn, vì nó cho mọi người thứ để nhận diện hoặc phản đối. Và khi càng nhiều người đồng nhất với hyperpop, càng nhiều nghệ sĩ cũng bắt đầu sáng tác nhạc hyperpop. Trong khi đó, nhóm người nghe tương tự trong thuật toán ngày càng lớn, và Spotify tiếp tục đẩy mạnh nó, bởi vì các nền tảng này muốn khuếch đại xu hướng văn hóa để giữ chân bạn trên ứng dụng. Nhưng điều đó cũng có nghĩa là chúng ta dần mất đi ranh giới giữa một xu hướng thật và một xu hướng bị thổi phồng bởi thuật toán.


02:34 – hết đoạn

EN: And yet, this is how all fads now enter the mainstream. We start with a latent cultural desire. Maybe some people are interested in matcha, Labubu or Dubai chocolate. The algorithm identifies this desire and pushes it to similar users, making the phenomenon more of a thing. But again, just like how ChatGPT misrepresented the word "delve," the algorithm is probably misrepresenting reality. Now more businesses are making Labubu content because they think that's the desire. More influencers are also making Labubu trends because we have to tap into trends to go viral. And yet, the algorithm is only showing you the visually provocative items that work in the video format.


VI: Tuy nhiên, đó chính là cách mà mọi trào lưu ngày nay bước vào dòng chính. Chúng ta bắt đầu từ một mong muốn văn hóa tiềm ẩn. Có thể một số người quan tâm đến matcha, Labubu hay socola Dubai. Thuật toán nhận diện nhu cầu này và đẩy nó đến những người dùng tương tự, khiến hiện tượng này trở nên rõ ràng hơn. Nhưng một lần nữa, giống như cách ChatGPT làm sai lệch từ “delve,” thuật toán có thể cũng đang làm sai lệch thực tế. Giờ đây, nhiều doanh nghiệp tạo nội dung về Labubu vì họ nghĩ đó là nhu cầu. Nhiều influencer cũng làm theo xu hướng Labubu vì phải bắt trend để lan truyền. Nhưng thực tế, thuật toán chỉ đang cho bạn thấy những nội dung gây ấn tượng thị giác mạnh — những thứ hoạt động tốt trong định dạng video.

03:11 – 03:42

EN: TikTok has a limited idea of who you are as a user, and there's no way that matches up with your complex desires as a human being. So we have a biased input. And that's assuming that social media is trying to faithfully represent reality, which it isn't. It's only trying to do what's going to make money for them. It's in Spotify's interest to have you listening to hyperpop, and it’s in TikTok’s to have you looking at Labubus because that's commodifiable. So again, we have this difference between reality and representation, where they're actually constantly influencing one another.


VI: TikTok chỉ có một hiểu biết hạn chế về bạn với tư cách người dùng, và điều đó không thể nào phản ánh đầy đủ những mong muốn phức tạp của bạn với tư cách con người. Vì vậy, dữ liệu đầu vào đã mang tính thiên lệch. Và đó còn là khi giả định rằng mạng xã hội đang cố gắng phản ánh thực tế một cách trung thực — nhưng thực tế thì không phải. Nó chỉ cố làm những gì mang lại lợi nhuận cho họ. Spotify muốn bạn nghe hyperpop, còn TikTok muốn bạn xem Labubu vì những thứ đó có thể kiếm tiền. Vì vậy, một lần nữa, ta thấy sự khác biệt giữa thực tế và sự biểu diễn, và chúng thực ra luôn tác động qua lại lẫn nhau.


03:42 – 04:19

EN: But it's incredibly dangerous to ignore that distinction, because this goes beyond our language and consumptive behaviors. This affects the world we see as possible. Evidence suggests that ChatGPT is more conservative when speaking the Farsi language, likely because of the limited training texts in Iran reflect the more conservative political climate in the region. Does that mean that Iranian ChatGPT users will think more conservative thoughts? Elon Musk regularly makes changes to his chatbot Grok when he doesn't like how it's responding, and then uses his platform X to artificially amplify his tweets. Does that mean that the millions of Grok and X users are subconsciously being trained to align with Musk's ideology?


VI: Nhưng việc bỏ qua sự khác biệt này là cực kỳ nguy hiểm, vì nó không chỉ ảnh hưởng đến ngôn ngữ và hành vi tiêu dùng của chúng ta. Nó còn ảnh hưởng đến cách chúng ta hình dung thế giới có thể như thế nào. Có bằng chứng cho thấy ChatGPT trở nên bảo thủ hơn khi sử dụng tiếng Ba Tư, có thể vì dữ liệu huấn luyện hạn chế ở Iran phản ánh môi trường chính trị bảo thủ hơn trong khu vực. Điều đó có nghĩa là người dùng ChatGPT ở Iran sẽ có xu hướng suy nghĩ bảo thủ hơn không? Elon Musk thường xuyên chỉnh sửa chatbot Grok của mình khi ông không hài lòng với cách nó phản hồi, rồi sử dụng nền tảng X để khuếch đại các tweet của mình một cách nhân tạo. Điều đó có nghĩa là hàng triệu người dùng Grok và X đang vô thức được “huấn luyện” để phù hợp với hệ tư tưởng của Musk không?


04:19 – 04:42

EN: We need to constantly remember that these aren't neutral tools. Everything that ends up in your social media feed or in your chatbot responses is actually filtered through many layers of what's good for the platform, what makes money and what conforms to the platform’s incorrect idea about who you are. When we ignore this, we view reality through a constant survivorship bias, which affects our understanding of the world.


VI: Chúng ta cần luôn ghi nhớ rằng đây không phải là những công cụ trung lập. Mọi thứ xuất hiện trên bảng tin mạng xã hội hay trong phản hồi của chatbot đều đã được lọc qua nhiều lớp: cái gì có lợi cho nền tảng, cái gì kiếm ra tiền, và cái gì phù hợp với cách mà nền tảng (có thể sai lệch) hiểu về bạn. Khi bỏ qua điều này, chúng ta nhìn nhận thực tế qua một dạng thiên lệch sống sót liên tục, điều này làm méo mó cách chúng ta hiểu thế giới.


04:42 – 05:01

EN: After all, if you're talking more like ChatGPT, you're probably thinking more like ChatGPT as well, or TikTok or Spotify. But you can fight this if you constantly ask yourself: Why? Why am I seeing this? Why am I saying this? Why am I thinking this? And why is the platform rewarding this?


VI: Rốt cuộc, nếu bạn nói chuyện giống ChatGPT hơn, thì có lẽ bạn cũng đang suy nghĩ giống ChatGPT hơn — hoặc giống TikTok hay Spotify. Nhưng bạn có thể chống lại điều này nếu bạn liên tục tự hỏi: Tại sao? Tại sao tôi lại thấy cái này? Tại sao tôi lại nói như vậy? Tại sao tôi lại nghĩ như vậy? Và tại sao nền tảng lại “thưởng” cho điều này?


05:01 – hết đoạn

EN: If you don't ask yourself these questions, their version of reality is going to become your version of reality. So stay real.


VI: Nếu bạn không tự đặt ra những câu hỏi này, phiên bản thực tế của họ sẽ trở thành phiên bản thực tế của bạn. Vì vậy, hãy giữ cho mình tỉnh táo và chân thực.

======


Comments