Languages don’t all have the same number of terms for colors – scientists have a new theory why

People with standard vision can see millions of distinct colors. But human language categorizes these into a small set of words.

In an industrialized culture, most people get by with 11 color words: black, white, red, green, yellow, blue, brown, orange, pink, purple and gray. That’s what we have in American English.

Maybe if you’re an artist or an interior designer, you know specific meanings for as many as 50 or 100 different words for colors – like turquoise, amber, indigo or taupe. But this is still a tiny fraction of the colors that we can distinguish.

Interestingly, the ways that languages categorize color vary widely. Nonindustrialized cultures typically have far fewer words for colors than industrialized cultures.

So while English has 11 words that everyone knows, the Papua-New Guinean language Berinmo has only five, and the Bolivian Amazonian language Tsimane’ has only three words that everyone knows, corresponding to black, white and red.

The goal of our project was to understand why cultures vary so much in their color word usage.

Is it about which colors stand out the most?

The most widely accepted explanation for the differences goes back to two linguists, Brent Berlin and Paul Kay. In their early work in the 1960s, they gathered color-naming data from 20 languages.

They observed some commonalities among sets of color terms across languages: If a language had only two terms, they were always black and white; if there was a third, it was red; the fourth and fifth were always green and yellow (in either order); the sixth was blue; the seventh was brown; and so on.

Based on this order, Berlin and Kay argued that certain colors were more salient. They suggested that cultures start by naming the most salient colors, bringing in new terms one at a time, in order. So black and white are the most salient, then red, and so on.

While this approach seemed promising, there are several problems with this innate vision-based theory.

Berlin, Kay and their colleagues went on to gather a much larger data set, from 110 nonindustrialized languages. Their original generalization isn’t as clear in this larger data set: there are many exceptions, which Kay and his colleagues have tried to explain in a more complicated vision-based theory.

What’s more, this nativist theory doesn’t address why industrialization, which introduced reliable, stable and standardized colors on a large scale, causes more color words to be introduced.

The visual systems of people across cultures are the same: in this model, industrialization should make no difference on color categorization, which was clearly not the case.

How do you describe this color?

Our research groups therefore explored a completely different idea: Perhaps color words are developed for efficient communication.

Consider the task of simply naming a color chip from some set of colors. In our study, we used 80 color chips, selected from Munsell colors to be evenly spaced across the color grid.

Each pair of neighboring colors is the same distance apart in terms of how different they appear. The speaker’s task is to simply label the color with a word (“red,” “blue” and so on).

To evaluate the communication-based idea, we need to think of color-naming in simple communication terms, which can be formalized by information theory.

Suppose the color I select at random is N4. I choose a word to label the color that I picked. Maybe the word I choose is “blue.” If I had picked A3, I would have never said “blue.” And if I had picked M3, maybe I would have said “blue,” maybe “green” or something else.

Now in this thought experiment, you as a listener are trying to guess which physical color I meant.

You can choose a whole set of color chips that you think corresponds to my color “blue.” Maybe you pick a set of 12 color chips corresponding to all those in columns M, N and O.

I say yes, because my chip is in fact one of those. Then you split your set in half and guess again.

The number of guesses it takes the ideal listener to zero in on my color chip based on the color word I used is a simple score for the chip.

We can calculate this score – the number of guesses or “bits” – using some simple math from the way in which many people label the colors in a simple color-labeling task.

Using these scores, we can now rank the colors across the grid, in any language.

In English, it turns out that people can convey the warm colors – reds, oranges and yellows – more efficiently (with fewer guesses) than the cool colors – blues and greens.

You can see this in the color grid: There are fewer competitors for what might be labeled “red,” “orange” or “yellow” than there are colors that would be labeled “blue” or “green.”

This is true in spite of the fact that the grid itself is perceptually more or less uniform: The colors were selected to completely cover the most saturated colors of the Munsell color space, and each pair of neighboring colors looks equally close, no matter where they are on the grid.

We found that this generalization is true in every language in the entire World Color Survey (110 languages) and in three more that we did detailed experiments on: English, Spanish and Tsimane’.

It’s clear in a visual representation, where each row is an ordering of the color chips for a particular language. The left-to-right ordering is from easiest to communicate (fewest guesses needed to get the right color) to hardest to communicate.

The diagram shows that all languages have roughly the same order, with the warm colors on the left (easy to communicate) and the cool ones on the right (harder to communicate).

This generalization occurs in spite of the fact that languages near the bottom of the figure have few terms that people use consistently, while languages near the top (like English and Spanish) have many terms that most people use consistently.

We name the colors of things we want to talk about

In addition to discovering this remarkable universal across languages, we also wanted to find out what causes it. Recall that our idea is that maybe we introduce words into a language when there is something that we want to talk about. So perhaps this effect arises because objects – the things we want to talk about – tend to be warm-colored.

We evaluated this hypothesis in a database of 20,000 photographs of objects that people at Microsoft had decided contained objects, as distinct from backgrounds. (This data set is available to train and test computer vision systems that are trying to learn to identify objects.)

Our colleagues then determined the specific boundaries of the object in each image and where the background was.

We mapped the colors in the images onto our set of 80 colors across the color space.

It turned out that indeed objects are more likely to be warm-colored, while backgrounds are cool-colored.

If an image’s pixel fell within an object, it was more likely to correspond to a color that was easier to communicate. Objects’ colors tended to fall further to the left on our ranked ordering of communicative efficiency.

When you think about it, this doesn’t seem so surprising after all. Backgrounds are sky, water, grass, trees: all cool-colored. The objects that we want to talk about are warm-colored: people, animals, berries, fruits and so on.

Our hypothesis also easily explains why more color terms come into a language with industrialization. With increases in technology come improved ways of purifying pigments and making new ones, as well as new color displays.

So we can make objects that differ based only on color – for instance, the new iPhone comes in “rose gold” and “gold” – which makes color-naming even more useful.

So contrary to the earlier nativist visual salience hypothesis, the communication hypothesis helped identify a true cross-linguistic universal – warm colors are easier to communicate than cool ones – and it easily explains the cross-cultural differences in color terms.

It also explains why color words often come into a language not as color words but as object or substance labels. For instance, “orange” comes from the fruit; “red” comes from Sanskrit for blood. In short, we label things that we want to talk about.


Các ngôn ngữ không phải tất cả đều có cùng những thuật ngữ cho màu sắc - các nhà khoa học có một lý thuyết mới tại sao như thế.

Những người có tầm nhìn tiêu chuẩn có thể nhìn thấy hàng triệu các màu sắc khác biệt. Nhưng ngôn ngữ của con người chia chúng thành những chuỗi từ nhỏ.

Trong nền văn hoá công nghiệp hóa, hầu hết mọi người đều có 11 từ chỉ màu sắc: đen, trắng, đỏ, lục, vàng, lam, nâu, cam, hồng, tím và xám. Đó là những gì chúng ta có trong tiếng Anh- Mỹ.

Có thể nếu bạn là một nghệ sĩ hoặc một nhà thiết kế nội thất, bạn sẽ biết nghĩa cụ thể cho khoảng 50 đến 100 từ khác nhau cho màu sắc - như màu ngọc lam, hổ phách, chàm hoặc nâu đất. Nhưng đây vẫn chỉ là một phần nhỏ của những màu sắc mà chúng ta có thể phân biệt.

Thật thú vị, cái cách mà các ngôn ngữ phân loại màu sắc biến đổi theo từng ngôn ngữ. Các nền văn hoá phi công nghiệp hóa thường có ít từ chỉ màu sắc hơn so với các nền văn hoá công nghiệp hóa.

Vì vậy, trong khi tiếng Anh có 11 từ mà mọi người đều biết, thì tiếng Berinmo ở quốc gia Pa-pua Niu Ghi-nê chỉ có 5 từ, và tiếng Tsimane ' của người Amazon ở Bô-li-vi-a chỉ có ba từ mà mọi người đều biết, tương ứng với màu đen, trắng và đỏ.

Mục tiêu dự án của chúng tôi là để hiểu được tại sao các nền văn hoá khác nhau khác nhiều trong cách sử dụng từ chỉ màu sắc.

Có phải là về những màu nào nổi bật nhất?

Giải thích được chấp nhận phổ biến nhất cho sự khác biệt này thuộc về hai nhà ngôn ngữ học, Brent Berlin và Paul Kay. Trong những tác phẩm đầu tiên của họ vào những năm 1960, họ đã thu thập dữ liệu đặt tên màu sắc từ 20 ngôn ngữ.

Họ đã quan sát thấy một số điểm tương đồng giữa các tập hợp các thuật ngữ chỉ màu sắc trên các ngôn ngữ: Nếu một ngôn ngữ chỉ có hai thuật ngữ, chúng luôn có màu đen và trắng; nếu có từ thứ ba, thì đó là màu đỏ; thứ tư và thứ năm luôn là xanh lá và vàng (theo thứ tự); thứ sáu là màu xanh dương; thứ bảy là màu nâu; và cứ như vậy.

Dựa vào đơn đặt hàng này, Berlin và Kay lập luận rằng một số màu sắc nổi bật hơn. Họ gợi ý rằng các nền văn hoá bắt đầu bằng cách đặt tên các màu sắc nổi bật nhất, mang theo các điều khoản mới một lần, theo thứ tự. Vì vậy, màu đen và trắng là nổi bật nhất, sau đó màu đỏ, và như vậy.

Mặc dù cách tiếp cận này có vẻ đầy hứa hẹn, nhưng lại có nhiều vấn đề với lý thuyết dựa trên thị giác bẩm sinh này.

Berlin, Kay và các đồng nghiệp của họ đã thu thập được một bộ dữ liệu lớn hơn, từ 110 ngôn ngữ phi công nghiệp hóa. Sự tổng quát ban đầu của chúng không rõ ràng trong tập dữ liệu lớn hơn: có nhiều ngoại lệ, mà Kay và các đồng nghiệp của ông đã cố gắng giải thích trong lý thuyết dựa trên thị giác phức tạp hơn.

Hơn nữa, lý thuyết tự nhiên này không đề cập đến lý do tại sao công nghiệp hóa, cái mà đưa ra các màu đáng tin cậy, ổn định và chuẩn hóa màu sắc trên phạm vi lớn, sẽ tạo ra nhiều từ chỉ màu sắc hơn.

Hệ thống thị giác của người dân qua các nền văn hoá giống nhau: trong mô hình này, công nghiệp hóa sẽ không có sự khác biệt về phân loại màu sắc, cái mà rõ ràng không phải là trường hợp duy nhất.


Các nhóm nghiên cứu của chúng tôi đã khám phá ra một ý tưởng hoàn toàn khác: Có lẽ từ chỉ màu sắc được phát triển việc giao tiếp có hiệu quả.

Xem xét nhiệm vụ của việc đặt tên đơn giản cho một chip màu từ một số bộ màu sắc. Trong nghiên cứu của chúng tôi, chúng tôi sử dụng 80 chip màu, được lựa chọn từ bản màu Munsell được chia đều trên lưới màu.

Mỗi cặp màu sắc kế nhau là cùng một khoảng cách về sự khác biệt mà chúng xuất hiện. Nhiệm vụ của người nói là chỉ đơn giản là dán nhãn cho màu sắc bằng một từ ngữ ("đỏ", "xanh" và v.v.).

Để đánh giá ý tưởng dựa trên truyền thông, chúng ta cần phải suy nghĩ về việc đặt tên màu trong các thuật ngữ truyền thông đơn giản, điều này có thể được định hình theo lý thuyết thông tin.

Giả sử màu tôi chọn một cách ngẫu nhiên là N4. Tôi chọn một từ để ghi nhãn màu mà tôi đã chọn. Có lẽ từ tôi chọn là "xanh". Nếu tôi chọn A3, tôi sẽ không bao giờ nói "xanh". Và nếu tôi chọn M3, có thể tôi đã nói "xanh dương", cũng có thể là "xanh lá" hoặc cái gì đó khác.

Bây giờ trong thử nghiệm tư duy này, bạn với tư cách người nghe đang cố gắng đoán màu sắc mà tôi muốn nói.

Bạn có thể chọn một bộ chip màu mà bạn nghĩ tương ứng với màu "xanh dương" của tôi. Có lẽ bạn chọn một bộ 12 chip màu tương ứng với tất cả các cột M, N và O.

tôi nói phải, bởi vì chip của tôi là một trong số chúng, trong thực tế. Sau đó bạn chia nhỏ bộ của bạn và đoán lại.

Số lần đoán mà người nghe lý tưởng là số không trong chip màu của tôi dựa trên từ chỉ màu tôi sử dụng là một điểm số đơn giản cho chip.

Chúng ta có thể tính toán điểm số này - số lần đoán hoặc "các bit" - sử dụng một số phép toán đơn giản từ cách thức mà nhiều người gắn nhãn cho các màu sắc trong một nhiệm vụ dán nhãn màu đơn giản.

Sử dụng các điểm số này, bây giờ chúng ta có thể xếp hạng các màu sắc trên lưới, bằng bất kỳ ngôn ngữ nào.

Trong tiếng Anh, người ta có thể truyền tải những màu ấm áp - đỏ, cam và vàng - hiệu quả hơn (với ít lời đoán) hơn so với các màu sắc mát mẻ - màu xanh dương và màu xanh lá cây.

Bạn có thể thấy điều này trong lưới màu: Có ít đối thủ cạnh tranh hơn cho những gì có thể được gắn nhãn "đỏ", "cam" hoặc "màu vàng" hơn là có màu sắc được gắn nhãn "xanh dương" hoặc "xanh lá".

Điều này đúng mặc dù thực tế lưới màu nhận thức nhiều hoặc ít đồng nhất: Màu sắc được lựa chọn để hoàn toàn che phủ hầu hết các màu bão hòa của không gian bản màu Munsell, và mỗi cặp màu sắc lân cận có vẻ gần như nhau, cho dù chúng nằm ở đâu trên lưới màu.

Chúng tôi thấy rằng khái quát này là đúng trong mọi ngôn ngữ trong toàn bộ cuộc khảo sát màu sắc của Khảo sát màu sắc thế giới (110 ngôn ngữ) và trong hơn ba lần nữa chúng tôi đã thực hiện các thí nghiệm chi tiết trong: tiếng Anh, Tây Ban Nha và tiếng Tsimane '.

Nó rõ ràng trong một hình ảnh đại diện, nơi mỗi hàng là một sự sắp xếp của các chip màu cho một ngôn ngữ cụ thể. Thứ tự từ trái sang phải là từ giao tiếp dễ dàng nhất (cần ít lời đoán nhất để có được màu đúng) đến giao tiếp khó nhất.

Sơ đồ cho thấy rằng tất cả các ngôn ngữ có cùng một thứ tự, với màu ấm ở bên trái (dễ giao tiếp) và những màu mát mẻ ở bên phải (khó giao tiếp hơn).

Sự tổng quát này xảy ra mặc dù ngôn ngữ gần cuối sơ đồ có ít thuật ngữ mà mọi người sử dụng nhất quán, trong khi các ngôn ngữ gần đầu sơ đồ (như tiếng Anh và tiếng Tây Ban Nha) có nhiều thuật ngữ mà hầu hết mọi người sử dụng đều đặn.


Ngoài việc khám phá ra sự đa dạng vượt trội trên các ngôn ngữ, chúng tôi cũng muốn tìm hiểu nguyên nhân của nó. Nhớ lại ý tưởng của chúng tôi là có lẽ chúng tôi đưa những từ vào một ngôn ngữ khi có điều gì đó mà chúng ta muốn nói đến. Vì vậy, có lẽ hiệu ứng này phát sinh bởi vì các đối tượng - những điều chúng ta muốn nói về - thường có màu ấm.

Chúng tôi đã đánh giá giả thuyết này trong một cơ sở dữ liệu gồm 20.000 bức ảnh về những đồ vật mà mọi người ở Microsoft đã quyết định các đồ vật được chứa đựng, khác xa với hình nền. (Tập dữ liệu này có sẵn để đào tạo và kiểm tra các hệ thống quan sát bằng máy tính đang cố gắng tìm hiểu để xác định các đối tượng.)

Các đồng nghiệp của chúng tôi sau đó xác định ranh giới cụ thể của đối tượng trong mỗi hình ảnh và hình nền ở đâu.

Chúng tôi ánh xạ các màu sắc trong các hình ảnh lên bộ 80 màu của chúng tôi trên không gian màu.

Nó hóa ra rằng thực sự các đối tượng có nhiều khả năng có màu ấm, trong khi nền là màu mát.

Nếu điểm ảnh của một bức ảnh rơi vào trong một đối tượng, thì nó sẽ tương ứng với màu sắc dễ giao tiếp hơn. Màu sắc của các đối tượng có khuynh hướng giảm hơn nữa theo thứ tự xếp hạng của chúng ta về hiệu quả giao tiếp.

Khi bạn nghĩ về nó, điều này không có vẻ gì là đáng ngạc nhiên sau tất cả. Nền là bầu trời, nước, cỏ, cây: tất cả đều là màu mát mẻ. Các đối tượng mà chúng ta muốn nói đến là màu ấm áp: con người, động vật, hoa quả, trái cây và tương tự.

Giả thuyết của chúng tôi cũng dễ dàng giải thích vì sao nhiều thuật ngữ màu lại trở thành một ngôn ngữ với sự công nghiệp hóa. Với sự gia tăng về công nghệ, cải tiến cách làm sạch các sắc tố và tạo ra những màu mới, cũng như màu sắc mới hiển thị.

Vì vậy, chúng ta có thể tạo ra các đối tượng khác nhau chỉ dựa trên màu sắc - ví dụ iPhone mới xuất hiện trong màu "hồng vàng" và "vàng" - làm cho việc đặt tên màu thậm chí còn hữu ích hơn.

Vì vậy trái ngược với giả thuyết về sự thịnh vượng của hình tượng tự nhiên ban đầu, giả thuyết giao tiếp đã giúp xác định được một màu sắc phổ quát thực sự - màu ấm áp xuyên ngôn ngữ thật sự dễ dàng giao tiếp hơn so với các màu mát - và nó dễ dàng giải thích sự khác nhau giữa các văn hoá về màu sắc.

Nó cũng giải thích tại sao các từ màu thường đi vào một ngôn ngữ không phải là từ chỉ màu sắc mà là đối tượng hoặc nhãn chất. Chẳng hạn, "màu cam" xuất phát từ trái cây; "màu đỏ" đến từ tiếng Phạn chỉ máu. Nói tóm lại, chúng ta dán nhãn cho những điều mà chúng ta muốn nói về.