Cuộc tranh luận về ngôn ngữ nào có nhiều từ nhất có thể diễn ra trong một thời gian khá dài. Và vấn đề ở đây không phải là thiếu dữ liệu chính xác, mà là các đặc điểm ngôn ngữ của từng ngôn ngữ. Trước hết, nó nhầm lẫn câu hỏi về chính xác những gì có thể được coi là một từ và một ngôn ngữ.
Theo ý kiến phổ biến, một từ có thể được mô tả như một tập hợp các chữ cái nằm giữa hai không gian. Nhưng nếu bạn lấy, ví dụ, ngôn ngữ của Greenland Eskimos, thì trong đó trong một từ được coi là toàn bộ câu. Có những vấn đề trong các ngôn ngữ ít kỳ lạ. Ví dụ, ngôn ngữ Séc ngụ ý sự hợp nhất của hạt không phải là động từ với động từ, trong tiếng Thổ Nhĩ Kỳ, sự phủ định này nằm ở trung tâm của từ. Vì vậy, theo quy tắc của chúng tôi, hóa ra mỗi từ có phủ định trong đó nên được xem xét riêng.
Câu hỏi được đặt ra: còn những từ có kết thúc khác nhau (ví dụ, thì beautiful beautiful, thì beautiful beautiful,, beautiful beautiful,), cũng như các từ đồng âm - ví dụ, một lâu đài như một tòa nhà và một lâu đài như một thiết bị? Có thể tính là các từ riêng biệt các chữ viết tắt - KVN, KGB, ATS, v.v.? Trong mọi ngôn ngữ, có hàng chục ngàn thủ thuật tương tự.
Thậm chí khó khăn hơn là những câu hỏi liên quan đến chính xác những gì được coi là một ngôn ngữ. Các phương ngữ và phương ngữ khác nhau có thể liên quan đến các ngôn ngữ riêng lẻ hay chúng là giống của ngôn ngữ chính? Ví dụ, ở Châu Phi và Châu Âu, điều thường xảy ra là không thể xác định ngay ngôn ngữ nào cho một phương ngữ nhất định là ngôn ngữ chính. Và có thể nói rõ ràng về ngôn ngữ mà một số từ thuộc về ngôn ngữ nào không? Ví dụ, những người ăn chay hay người Hồi giáo là những từ tiếng Ukraina hay tiếng Nga? Những từ "trang web", "máy chủ", "nhà cung cấp" có thể nói đến - tiếng Nga, tiếng Anh, tiếng Đức hoặc tất cả cùng một lúc?
Do đó, đáng để chúng ta chỉ giới hạn trong các tính toán chung mà không cho là khoa học. Đối với ngôn ngữ Nga, nó, theo các nhà ngôn ngữ học, chứa khoảng 500.000 từ. Con số này là gần đúng và không bao gồm các thuật ngữ khoa học cụ thể. Nhưng ở đây có lỗi thời, mượn từ các ngôn ngữ khác, từ ghép, hình thức trìu mến, nhỏ gọn và những thứ khác. Nếu chúng ta chuyển sang Từ điển học thuật lớn có thẩm quyền, bao gồm mười bảy tập, nó sẽ chứa 131.257 từ. Tuy nhiên, cần lưu ý rằng năm xuất bản của nó là năm 1970 và ngôn ngữ tiếng Nga đã trải qua nhiều thay đổi trong 40 năm qua và đã được làm phong phú đáng kể bởi các khái niệm như, ví dụ như, per perroroika,, Internet Internet, v.v.
Đối với ngôn ngữ tiếng Anh, theo giám sát của Global Language Monitor, năm 2009 số lượng từ vượt quá một triệu trong đó và tiếp tục tăng. Hơn nữa, từ thứ một triệu là "Web 2.0". Theo từ điển có thẩm quyền, tiếng Anh cũng đi trước tiếng Nga. Ví dụ, phiên bản thứ 3 của từ điển Webster chứa 450.000 từ, trong khi từ điển Oxford chứa khoảng 500.000 từ.
Quan tâm đặc biệt là các ngôn ngữ chữ tượng hình trong đó một biểu tượng duy nhất biểu thị không phải là một chữ cái, mà là toàn bộ từ. Trong trường hợp này, so sánh trực tiếp là hoàn toàn không thể. Tuy nhiên, nếu chúng ta so sánh từ điển, những ngôn ngữ như vậy, với sự ngạc nhiên của mọi người, sẽ mất rất nhiều. Ví dụ, từ điển tiếng Nhật đầy đủ nhất chứa 50.000 ký tự. Nhưng Bộ Giáo dục Nhật Bản chấp thuận cho sử dụng hàng ngày chỉ có 1850 ký tự. Ngôn ngữ Trung Quốc chứa khoảng 80 nghìn ký tự. Nhưng thực sự, ít hơn nhiều cũng được sử dụng ở đây. Được phê duyệt năm 1981, tiêu chuẩn nhà nước "Bộ chữ tượng hình cơ bản" bao gồm 6763 chữ tượng hình.
Các nhà lãnh đạo định lượng bất ngờ có được ngôn ngữ Ý. Trong đó, tất cả các chữ số tổng hợp được viết bằng các từ với nhau, bằng một từ. Chuỗi số, như bạn biết, là vô hạn, do đó số lượng từ trong tiếng Ý là vô hạn.