Thứ Bảy, 29 tháng 10, 2016

-(으)ㄹ 테니(까)

In this lesson, we are taking a look at the structure -(으)ㄹ 테니(까). This is used often in situations where one person wants, or asks, the other person to do something. When you use it after a verb stem that ends with a consonant, you add -을 테니(까), and when the verb stem ends with a vowel, you add -ㄹ 테니(까). The original form is -을 테니까 or -ㄹ 테니까, but it is always interchangeable with -을 테니 or -ㄹ 테니, with the last letter, 까, omitted.

Thứ Hai, 24 tháng 10, 2016

Từ vựng Tiếng Hàn có khoảng 500,000 từ

here’s a list for 11 of the most spoken languages around the world (sources given as hyperlinks):
LANGUAGELARGEST DICTIONARYNUMBER OF WORDS
Chinese汉语大词典 (Hanyu Da Cidian. Lit: Comprehensive Chinese Word Dictionary)370,000 words; 23,000 head Chinese character entries
EnglishThe Second Edition of the 20-volume Oxford English Dictionary171,476 words in current use, and 47,156 obsolete words; 615,100 definitions
DutchWoordenboek der Nederlandsche Taal(Dictionary of the Dutch language)430,000 words
FrenchLe Grand Robert de la langue française100,000 words; 350,000 definitions
GermanDer Duden135,000 words
ItalianGrande dizionario italiano dell’uso (Gradit)270,000 words
Japanese(日本国語大辞典)Nihon kokugo daijiten500,000 words (this includes definitions and etymologies of foreign loan words (gairaigo, 外来語), highly recent words (gendai yōgo, 現代用語), archaic words (kogo, 古語), idiomatic compound  phrases (jukugo, 熟語), words that can  be written using more than one possible Chinese character to produce subtle differences in meaning (dōkun iji, 同訓異字), and Chinese characters that are written differently but have the same pronunciation (iji dōkun, 異字同訓), some slang (ingo, 隠語), and words used only in regional dialects (hōgen, 方言))
Korean표준국어대사전 (Korean Standard Unabridged Dictionary)500,000 words (this includes 190,000 technical words (전문어), 70,000 North Korean words (북한어), 20,000 regionalisms (방언), and 12,000 old sayings (옛말))
RussianТолко́вый слова́рь живо́го великору́сского языка́(Explanatory Dictionary of the Living Great Russian Language; AKA Dahl’s Explanatory Dictionary)200,000 words
SpanishDiccionario de la Real Academia Española100,000 words
PortugueseVocabulário Ortográfico da Língua PortuguesaNearly 390,000 words

How many words does a native speaker use in daily life?

How many words does a native speaker use in daily life?
Green Eggs and Ham,” is a book written by Dr. Seuss (a pen-name of Theodor Seuss Geisel), whose vocabulary famously consists of just fifty different words. It was the result of a bet between Seuss and his publisher, Bennett Cerf, that Seuss (after completing The Cat in the Hat using 225 words) could not complete an entire book using so few words.
Obviously, if one can write a book using as few as 50 words, it makes no doubt that having a vocabulary of 40,000 words is not necessary for communicating. For your information, though, according to Susie Dent, lexicographer and expert in dictionaries, the average active vocabulary of an adult English speaker is of around 20,000 words, with a passive one of around 40,000 words.
What is the difference between an active and a passive vocabulary? Simply put, an active vocabulary is comprised of words that you can recall and use in a sentence yourself. A passive vocabulary, on the other hand, is a vocabulary that you can recognize and know the definition of words, but are not able to use yourself.
Now, here’s where it gets interesting: although an average adult native English speaker has an active vocabulary of about 20,000 words, the Reading Teachers Book of Lists claims that the first 25 words are used in 33% of everyday writing, the first 100 words appear in 50% of adult and student writing, and the first 1,000 words are used in 89% of every day writing! Of course, as we progressively move to a higher percentage, the number of words starts to dramatically increase (especially after 95% of comprehension), but it has been said that a vocabulary of just 3000 words provides coverage for around 95% of common texts (such as news items, blogs, etc.). Liu Na and Nation (1985) have shown that this is the rough amount of words necessary before we can efficiently learn from context with unsimplified text.
When it comes to Chinese, approximately 3,000 characters are required to read a Mainland newspaper. The PRC government defines literacy amongst workers as a knowledge of 2,000 characters, though this would be only functional literacy. Of course, given the nature of the Chinese language, 3000 characters equals to many, many more words. Nevertheless, the highest level (VI) of the new Hànyǔ Shuǐpíng Kǎoshì (HSK), also known as the Chinese Proficiency Test, is a vocabulary of 5000 words (2633 characters).
Finally, in French, the 600 most common words apparently account for 90% of words found in common texts, although I cannot verify the veracity of this claim. But I think you can see from the numbers here that really, in order to understand the biggest part of a language, it is not necessary to know tens of thousands of words. Generally speaking, a vocabulary of about 3000 words (not counting for inflexions, plurals, etc.), then, would be the number necessary to efficiently learn from context with unsimplified text.

Do the Math

We have seen that the Oxford English Dictionary contains 171,476 words in current use, whereas a vocabulary of just 3000 words provides coverage for around 95% of common texts. If you do the math, that’s 1.75% of the total number of words in use! That’s right, by knowing 1.75% of the English dictionary, you’ll be able to understand 95% of what you read. That’s still just 7.5% of the average passive vocabulary of a native speaker (3000 vs. 40,000 words). Isn’t that great news?
Let’s repeat the math for Chinese. The Hanyu Da Cidian contains 370,000 words, whereas 2500 words (1710 characters)Chinese Characters  are necessary in order to “read Chinese newspapers and magazines and watch Chinese films”, according to the HSK test(level 5). That’s 0.68% of the total number of words contained in the Hanyu Da Cidian! Knowing 5000 words, the minimum number required to pass the highest HSK test (level 6), would mean knowing 1.35% of the total number of words contained in the Hanyu Da Cidian.

Pareto’s Law and Language Learning

We will end this already lengthy article by once more taking a look at Pareto’s Law, also known as the 80-20 rule. If you’ve already forgot, the law states that for many events, roughly 80% of the effects come from 20% of the causes. In other words, in the context of work or study, 20% of the efforts bring in 80% of the results.
Vilfredo Pareto portrait
Italian Economist Vilfredo Pareto
If we drop the unrealistic figures of the number of words in the largest dictionaries out there, and we instead count the number of words an average educated native speaker knows, which is around 30 to 40 thousand for many languages, we will find out that Pareto’s Law works on steroids! In many cases, knowing just 5-7% of the total number of words that a native speaker knows will allow you to understand anywhere from 90 to 95% of the vocabulary found in common texts! That’s right, 5 to 7% of the effort brings you 95% of the results. That is great news for you my friend.
So yes, languages contain fabulous numbers of words, and for many, learning a foreign language seems like an insurmountable barrier, something that takes dozens of years to accomplish. But the fact is, by learning from the very beginning words in context (I highly recommend the Assimil method), and by gradually building your vocabulary to around 2500-3000 words, it is possible to reach quite rapidly a level at which you will be able to read common texts in the language and understand anywhere from 90 to 95% of it. This is essentially the “golden” number, since this amount of understanding is enough not to make reading in the language a frustrating experience. More importantly, though, this is the roughamount of words necessary before you’ll be able to efficiently learn from context.
—————————-
Have you enjoyed this article? Have you learned something out of it? A “like” on Facebook means a great deal to us. And if you want to be even more awesome, like, super awesome, share this article with your friends on Facebook and Twitter!

Thứ Sáu, 21 tháng 10, 2016

(이)라며

From -는다( ) meaning: 1) while saying that "QUOTE," ..., and 2) Is it true that "QUOTE?"

From <http://www.koreangrammaticalforms.com/entry.php?eid=0000001673>
사업을 방해하는 자는 누구든지 반동이라며  소리를 질렀다. (학마을 )
They screamed that anyone who gets in the way of business are all reactionaries.

From <http://www.koreangrammaticalforms.com/entry.php?eid=0000001673>

박종화 울산과기원(UNIST) 생명과학과 교수는 "많아야 1500~2000만개 정도"라며 "크게 차이 나지 않는다"고 설명했다.


From <http://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=105&oid=009&aid=0003822520

(으)며 và (으)면서

() là dạng văn-học của ()면서 (đang làm cái này thì làm cái kia, vừa làm việc này vừa làm việc kia.)
Vd:

나는 고개를 끄덕이 말했다 (무진 29)
I said while nodding. 

From <http://www.koreangrammaticalforms.com/entry.php?eid=0000001258>

그가 고개를 저으 웃었다 (첫눈 8)
Shaking his head, he laughed.

From <http://www.koreangrammaticalforms.com/entry.php?eid=0000001258>


오징어를 으며 말했다 (산행 18)
He said, chewing on dried squid.

From <http://www.koreangrammaticalforms.com/entry.php?eid=0000001258>


박종화 교수는 "아직까지 호모 사피엔스가 알고 있는 네안데르탈인의 염기서열은 극히 일부에 불과하다" "단지 호모 사피엔스와 비교해 어느 정도 차이가 난다는 데이터만 갖고 있을 "이라고 말했다


From <http://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=105&oid=009&aid=0003822520

Thứ Ba, 11 tháng 10, 2016

[Song] 홍시 (울엄마) by 나훈아 (Mùa hồng chín con nhớ mẹ)


Lời tiếng Hàn:
생각이 난다 홍시가 열리면 울엄마가 생각이 난다 
자장가 대신 젖가슴을 내 주던 울엄마가 생각이 난다 
눈이 오면 눈맞을 세라 비가 오면 비젖을 세라 
험한 세상 넘어질 세라 사랑 땜에 울먹일 세라 
그리워 진다 홍시가 열리면 울엄마가 그리워 진다 
눈에 넣어도 아프지도 않겠다던 울엄마가 그리워 진다. 

생각이 난다 홍시가 열리면 울엄마가 생각이 난다 
회초리 치고 돌아앉아 우시던 울엄마가 생각이 난다 
바람 불면 감기들 세라 안 먹어서 약해질 세라 
힘든 세상 뒤쳐질 세라 사랑 땜에 아파할 세라 
그리워 진다 홍시가 열리면 울엄마가 그리워 진다 
생각만 해도 눈물이 핑 도는 울엄마가 그리워 진다 

생각만 해도 가슴이 찡 하는 울엄마가 그리워 진다 
울엄마가 생각이 난다 울엄마가 보고파 진다.

Tiếng Việt:

Mỗi khi hồng bắt đầu chín con lại nghĩ về mẹ
Nhớ mẹ đã cho con bầu ngực thay cho bài hát ru
Nếu trời đổ tuyết thì mẹ sợ con gặp phải tuyết, nếu trời mưa thì mẹ sợ con bị ướt mưa
Mẹ sợ con trượt ngã trong cuộc đời đầy hiểm nguy, sợ con suýt khóc vì tình yêu
Mỗi khi hồng bắt đầu chín con lại nhớ về mẹ
Nhớ mẹ yêu quý nhất trần đời (nguyên văn: dù để vào mắt cũng không thấy đau đớn)
Mỗi khi vào mùa hồng chín con lại nghĩ về mẹ
Nhớ mẹ đánh roi xong rồi quay lưng khóc thầm
Nếu có gió thổi thì mẹ sợ con bị cảm lạnh, vì con không ăn nên mẹ sợ con yếu sức
Mẹ sợ con bị bỏ lại sau trong đường đời khó nhọc, sợ con đau đớn vì tình
Mỗi khi hồng chín con lại nghĩ về mẹ
Nhớ mẹ, chỉ nghĩ thôi mà nước mắt đã chảy vòng quanh

Nhớ mẹ, chỉ nghĩ thôi mà ngực nghẹn ngào
Con nghĩ về mẹ, con nhớ mẹ.

(Nguyễn Tiến Hải tạm dịch)

Chủ Nhật, 12 tháng 6, 2016

Why South Korea is the world’s biggest investor in research

(NATURE.COM) The Asian nation is spending big in the hope of winning a Nobel prize, but it will need more than cash to realize its ambitions.
01 June 2016 
Corrected: 03 June 2016


Shin Woong-Jae
A prototype axion detector in Daejeon, South Korea.

Behind the doors of a drab brick building in Daejeon, South Korea, a major experiment is slowly taking shape. Much of the first-floor lab space is under construction, and one glass door, taped shut, leads directly to a pit in the ground. But at the end of the hall, in a pristine lab, sits a gleaming cylindrical apparatus of copper and gold. It's a prototype of a device that might one day answer a major mystery about the Universe by detecting a particle called the axion — a possible component of dark matter.

Thứ Hai, 6 tháng 6, 2016

Đánh giá ảnh hưởng trong nghiên cứu khoa học qua chỉ số H


Vietsciences-Nguyễn Văn Tuấn     11/06/2008


Các cơ quan quản lí khoa học, kể cả đại học và cơ quan tài trợ nghiên cứu khoa học, thường phải đối đầu với một vấn đề tương đối nan giải: đó là đánh giá khách quan thành tựu của một nhà khoa học hay một công trình nghiên cứu. Đứng trước hàng trăm đơn xin tài trợ, hay hàng trăm đơn xin được bổ nhiệm một chức vụ khoa bảng, người quyết định phải dựa vào tiêu chuẩn gì để tuyển chọn một công trình hay một nhà khoa học? Đánh giá thành quả và thành tích của một nhà khoa học thường dựa vào sự đóng góp của nhà khoa học cho cộng đồng khoa học. Hai chữ “đóng góp” bao gồm năng suất làm việc, ảnh hưởng của công trình nghiên cứu đến cộng đồng khoa học quốc tế, và sự ghi nhận của đồng nghiệp trong ngành. Gần đây, chỉ số H (còn gọi là chỉ số Hirsch, hay H index) được đề nghị như là một thước đo về thành quả của một nhà khoa học. Trong bài này, tôi sẽ bàn qua những ưu điểm và khiếm khuyết của chỉ số này.

Số lượng và chất lượng

Đối với những nhà khoa học đã được trao giải Nobel, sự đóng góp và thành tựu của họ trong khoa học rất khó ai chất vấn được. Nhưng đối với 99,9% các nhà khoa học chưa có [hay không nằm trong phạm vi của] giải thưởng cao quí đó, việc đánh giá thành quả của họ là một vấn đề đa chiều kích (multidimension) và phức tạp. Đa chiều kích là vì thành quả khoa học phải được lượng hóa, nhưng cũng không thể bỏ qua chất lượng của các công trình nghiên cứu. Vấn đề trở nên nan giải khi tìm một công thức để quân bình giữa hai yếu tố lượng và phẩm đó. Trong quá khứ, giới quản lí đánh giá thành quả của một nhà khoa học thường chủ yếu dựa vào 3 chỉ số sau đây:

    • Số lượng bài báo khoa học công bố; 
    • Tổng số lần trích dẫn các bài báo; và 
    • Hệ số ảnh hưởng của tập san khoa học. 
Số lượng bài báo công bố trên các tập san quốc tế thường được xem là một thước đo về sự tích cực và năng suất nghiên cứu của một nhà khoa học. Cần nói thêm rằng cụm từ “tập san quốc tế” ở đây là chỉ những tập san khoa học có ban biên tập mà thành phần là các chuyên gia từ nhiều quốc gia, có hệ thống bình duyệt nghiêm chỉnh (peer review system), và được công nhận trong danh sách của Viện thông tin khoa học (Institute of Scientific Information). Theo cách hiểu và các tiêu chuẩn này, phần lớn -- nếu không muốn nói là hầu hết -- các tạp chí khoa học của nước ta chưa được xem là tập san quốc tế. Cũng cần nói thêm rằng “bài báo khoa học” ở đây chỉ tính những bài báo nguyên thủy (original paper) chứ không phải những bản tóm lược (abstract) nghiên cứu hay trình bày trong các hội nghị khoa học. Do đó, một người có nhiều bài báo khoa học công bố trên các tập san quốc tế là một chỉ số khá tốt phản ảnh năng suất lao động của nhà khoa học.

Tuy nhiên, số lượng bài báo chỉ phản ảnh phần lượng, mà có thể không phản ảnh được phần chất. Một nhà nghiên cứu có thể công bố nhiều bài báo khoa học, nhưng chất lượng nghiên cứu có thể không cao. Nhưng lấy gì để đánh giá “chất lượng” nghiên cứu của một nhà khoa học? Đây là một vấn đề gai góc, đã chiếm nhiều thì giờ và giấy mực của nhiều chuyên gia trên thế giới nhưng cho đến nay vẫn chưa có thước đo hoàn chỉnh. Trong khi chưa có một thước đo hoàn chỉnh, giới quản lí thường dựa vào uy tín hay độ ảnh hưởng của tập san mà họ từng công bố. Uy tín của một tập san thường được đo bằng hệ số ảnh hưởng (còn gọi là impact factor hay IF). Hệ số ảnh hưởng IF của một tập san khoa học là số lần trích dẫn trung bình trong năm cho các bài báo công bố trên tập san đó trong vòng 2 năm trước. Chẳng hạn như trong 2 năm 2003 và 2004 tập san y khoa Lancet công bố 450 bài báo khoa học, và trong năm 2005 có 10.500 bài báo khác trích dẫn 450 bài báo đó, thì hệ số IF = 10.500 / 450 = 23,3.

Các tập san thuộc bộ môn khoa học thực nghiệm như y sinh học và vật lí thường có hệ số IF cao hơn các tập san thuộc ngành toán học hay khoa học xã hội, nhưng điều này không có nghĩa là tập san các ngành đó có chất lượng thấp. Điều này có nghĩa là khi so sánh IF, người ta phải so sánh trong cùng ngành khoa học. Nói chung, ở mỗi chuyên ngành, tập san nào có chất lượng cao hay uy tín cao thường có hệ số IF cao. Do đó, dựa vào IF của tập san, người ta có thể đánh giá chất lượng nghiên cứu của nhà khoa học. Nhưng xin nhấn mạnh là “có thể”, bởi vì IF phản ảnh chất lượng của tập san chứ không hẳn bài báo khoa học trên tập san đó. Trong thực tế, có nhiều bài báo được công bố trên các tập san có IF thấp nhưng lại có ảnh hưởng rất lớn đến chuyên ngành.

Bởi vì IF phản ảnh chất lượng của tập san, giới quản lí phải đi tìm một chỉ số khác phản ảnh chất lượng nghiên cứu của cá nhân nhà khoa học. Một trong những chỉ số hấp dẫn là chỉ số trích dẫn (average citation) của cá nhân nhà khoa học. Chỉ số trích dẫn được tính bằng cách lấy tổng số lần trích dẫn chia cho số lượng bài báo khoa học của một tác giả. Chẳng hạn như tác giả VĐT công bố 116 bài báo khoa học, và các bài báo này đã được trích dẫn 1434 lần (kể cả tác giả tự trích dẫn), do đó, chỉ số trích dẫn là 1434 / 116 = 12,3. Nói cách khác, tính trung bình số lần trích dẫn cho mỗi công trình khoa học của tác giả này là 12,3 lần.

Việc diễn giải chỉ số trích dẫn cũng đôi khi gặp khó khăn. Theo phân tích của ISI, trong tất cả các bài báo khoa học công bố trên thế giới, có khoảng 55% các bài không bao giờ được ai (kể cả chính tác giả) trích dẫn sau 5 năm công bố ! Trong các ngành như kĩ thuật tần số không trích dẫn lên đến 70%. Ngay cả được trích dẫn và tham khảo, con số cũng rất khiêm tốn : chỉ có trên dưới 1% bài báo khoa học được trích dẫn hơn 6 lần mà thôi (trong vòng 5 năm). Do đó, có người đề nghị là một bài báo được trích dẫn một cách độc lập (tức không phải chính tác giả tự trích dẫn) hơn 5 lần được xem là "có ảnh hưởng". Những công trình có ảnh hưởng lớn thường có số lần trích dẫn 100 lần trở lên.

Tuy nhiên, các chỉ số dựa vào số lần trích dẫn như IF hay chỉ số trích dẫn cũng có khiếm khuyết quan trọng. Lí do đơn giản là vì có khi nhà khoa học có một vài bài báo được trích dẫn nhiều lần, nhưng đa số còn lại chẳng ai trích dẫn, thì chỉ số trích dẫn không phản ảnh được chính xác tình trạng này.

Chỉ số H
Trong nỗ lực đi tìm một chỉ số tốt hơn, năm 2005, nhà vật lí học Jorge Hirsch (Đại học California San Diego) tiến hành một phân tích khá qui mô về xu hướng công bố bài báo khoa học và trích dẫn, và sau cùng ông đề nghị một chỉ số mà ông lấy tên là H index (H có lẽ là viết tắt họ của ông). Chỉ số H được tính toán dựa vào số công trình công bố và số lần trích dẫn. Mục tiêu của chỉ số H là đo lường mức độ ảnh hưởng tích lũy của một nhà khoa học. Chỉ số H được định nghĩa như sau:Chỉ số H của một nhà khoa học là H công trình trong số N công trình của nhà khoa học đó được trích dẫn ít nhất là H lần, và (N – H) được trích dẫn dưới H lần. Ví dụ, nếu một nhà khoa học có chỉ số H = 20 có nghĩa là nhà khoa học này có 20 công trình nghiên cứu với mỗi công trình được trích dẫn ít nhất là 20 lần.

Nhìn qua định nghĩa trên của chỉ số H, dễ dàng thấy rằng đây là một chỉ số phản ảnh thành quả tích lũy của một nhà khoa học. Chỉ số H không có những khiếm khuyết mà các chỉ số khác gặp phải. Chẳng hạn như một nhà nghiên cứu có thể công bố hàng trăm ấn phẩm khoa học, nhưng trong số này chỉ có một số ít được trích dẫn thì chỉ số H vẫn không cao. Có thể nói rằng cái lợi thế lớn nhất của chỉ số H là nó chẳng những bao gồm hai yếu tố lượng và phẩm, mà còn quân bình hóa hai yếu tố này khá tốt.

Chỉ số H xem ra có tính hợp lí (validity). Hirsch chịu khó phân tích các nhà khoa học y sinh học, vật lí học, hóa học từng chiếm giải Nobel thì thấy 84% có chỉ số H trên 30. Những người được bầu vào Viện Hàn lâm Khoa học Mĩ có chỉ số H trung bình là 45. Khi so sánh những nghiên cứu sinh thành công xin học bổng hậu tiến sĩ (postdoctoral fellowship) và những người không thành công, thì chỉ số H của người thành công lúc nào cũng cao hơn người không thành công. Phân tích trên 147 nhà khoa học ở Hà Lan cho thấy hệ số tương quan giữa chỉ số H và uy tín cũng như số lần trích dẫn lên đến 0,89. Tất cả các dẫn chứng này cho thấy chỉ số H phản ảnh tốt chất lượng nghiên cứu và ảnh hưởng của nhà khoa học.

Diễn giải chỉ số H như thế nào? 


Vấn đề kế đến là diễn giải chỉ số H như thế nào? Trong bài báo trên PNAS [1], Hirsch viết rằng [tôi tạm dịch] một nhà khoa học với chỉ số H = 12 nên được xem là đủ tiêu chuẩn để vào biên chế đại học (tenure). Một nhà khoa học với H = 20 sau 20 năm làm khoa học có thể xem là một nhà khoa học thành công (successful); một chỉ số H = 40 sau 20 năm làm khoa học được xem là xuất sắc (outstanding) thường hay thấy ở các đại học hàng đầu hay viện nghiên cứu đẳng cấp quốc tế; một chỉ số H = 60 sau 20 năm làm nghiên cứu được xem là thật sự cá biệt (truly unique) [2]. Hirsch còn đề nghị rằng người có chỉ số H khoảng 12 có thể xem tương đương với giảng viên (lecturer hay senior lecturer), và người có H khoảng 18 trở lên có thể xem tương đương với đẳng cấp giáo sư. Phân tích chỉ số H của các nhà khoa học từng chiếm giải Nobel cho thấy chỉ số H trung bình của họ là 41 với độ lệch chuẩn 15. Một số nhà khoa học nổi tiếng hiện nay thường có chỉ số H trên 100. Tuy nhiên, chỉ số H của các nhà khoa học Việt Nam -- trong cũng như ngoài nước -- nói chung là còn rất khiêm tốn, chỉ dao động trong khoảng 2 đến 31, phần lớn là dưới 10.


Chỉ số H của một số nhà khoa học nổi tiếng 


Vật lí Ed Witten (Princeton) : 110
Martin Cohen (Berkeley) : 94
Philip Anderson (Princeton) : 91
Manuel Cardona (Max Planck) : 86
Frank Wilczek (MIT) : 68

Hóa học
George Whitesides (Harvard) : 135
Elias James Corey (Harvard) : 132
Martin Karplus (Harvard) : 129
Alan Heeger (California) : 114
Kurt Wurthrich (Switzerland) : 113

Khoa học máy tính 
Hector Garcia Molina (Stanford) : 70
Deborah Estrin (UCLA) : 68
Ian Foster (Illinois) : 67
Scott Shenker (Berkeley) : 65
Don Towsley (Massachusetts) : 65
Jeffrey Ullman (Stanford) : 65

Ngay từ khi chỉ số H ra đời, có nhiều người tán thành và lấy đó làm thước đo thành tựu và ảnh hưởng của một nhà khoa học. Ngày nay, các tập san khoa học danh tiếng như Nature, Science, Cell, PNAS, v.v… và các cơ quan quản lí khoa học ở Âu châu, Mĩ châu, Úc châu đều sử dụng chỉ số H để làm cơ sở cho đề bạt, cấp tài trợ, và đánh giá thành công của một nhà khoa học hay một nhóm nghiên cứu. Ngay cả Viện thông tin khoa học (ISI Thomson) cũng sử dụng chỉ số H trong báo cáo của họ [3].

Chuẩn hóa chỉ số H

Nhưng chỉ số H vẫn chưa hoàn hảo. Trong những khiếm khuyết mà giới khoa học chỉ ra trong thời gian qua, có 3 khiếm khuyết lớn như sau:
  • Thứ nhất, chỉ số H luôn luôn tăng theo thời gian, và do đó tùy thuộc vào độ tuổi của nhà nghiên cứu và thời gian làm nghiên cứu. Chẳng hạn như chỉ số H của một người đã làm nghiên cứu 35 năm có xu hướng cao hơn người có thời gian làm khoa học ngắn hơn. 
  • Thứ hai, chỉ số H không phân biệt được những nhà khoa học đã nghỉ hưu với những nhà khoa học đang làm việc. Chẳng hạn như nếu Albert Einstein chết vào năm 1906 thì chỉ số H của ông chỉ 4 hay 5, nhưng ai cũng biết công trình của ông có ảnh hưởng rất lớn đến khoa học. 
  • Thứ ba, chỉ số H còn tùy thuộc vào ngành khoa học. Nói chung, các ngành khoa học tự nhiên và thực nghiệm (như vật lí, y sinh học) có xu hướng công bố nhiều công trình nghiên cứu và thường hay trích dẫn nhau hơn các ngành khoa học như toán học hay xã hội học.
Để khắc phục các khiếm khuyết trên, một vài chỉ số khác đã được đề xuất để “điều chỉnh” chỉ số H. Để điều chỉnh cho thời gian làm nghiên cứu, Hirsch đề nghị chia chỉ số H cho thời gian làm nghiên cứu và ông gọi chỉ số này là Chỉ số m. Chẳng hạn như một người làm khoa học 35 năm với chỉ số H = 61 thì chỉ số m là 61 / 35 = 1,74.

Nhưng khiếm khuyết thứ ba là đáng quan tâm nhất. Chúng ta biết rằng các bộ môn khoa học có những văn hóa ngành khác nhau. Chẳng hạn như các ngành khoa học thực nghiệm thường có truyền thống trích dẫn cao hơn so với các ngành khoa học tự nhiên như toán học. Do đó, rất khó mà so sánh chỉ số H của một nhà vật lí học với một nhà toán học, nếu không có một cái gì đó để điều chỉnh. "Cái gì đó" chính là hệ số mà hai nhà nghiên cứu Tây Ban Nha đã phát triển [4]. Theo hai nhà nghiên cứu này, lấy ngành vật lí làm chuẩn, có thể tìm những hệ số điều chỉnh bằng cách xem xét xu hướng trích dẫn và chỉ số H của các nhà khoa học trong các bộ môn khoa học khác nhau. Qua những phân tích công phu và khá phức tạp, họ đề ra những hệ số chuẩn hóa như sau (xem Bảng 1).

Cách sử dụng hệ số này rất đơn giản. Chẳng hạn như nhà vật lí Ed Witten có chỉ số H = 110 và nhà hóa học Kurt Wurthrich có chỉ số H = 113, có thể nói rằng nhà hóa học này có thành tựu khoa học cao hơn nhà vật lí ? Để trả lời câu hỏi đó, chúng ta phải chuẩn hóa chỉ số H. Tra bảng 1 thấy hệ số điều chỉnh cho ngành hóa học là 0,92, và do đó chỉ số H của nhà hóa học này là : 113 × 0,92 = 103,6. Như vậy, sau khi điều chỉnh, nhà hóa học có lẽ có thành tựu khoa học kém hơn nhà vật lí.

Ngoài ra, còn có chỉ số khác như chỉ số g (g index), chỉ số H đương đại (contemporary H index), chỉ số H cá nhân (individual H index). Có thể tham khảo thêm các chỉ số này trong trang nhà của giáo sư Harzing. Tuy nhiên, khi so sánh các chỉ số mới này với chỉ số H, ngoài vài trường hợp cá biệt, không có gì khác nhau đáng kể. Do đó, cho đến nay giới quản lí khoa học vẫn sử dụng chỉ số H hay chỉ số H chuẩn hóa để đánh giá chất lượng và thành tựu của một nhà nghiên cứu khoa học. Chỉ số H còn có thể thay thế hệ số IF để đánh giá uy tín và chất lượng của một tập san khoa học [5] (xem Bảng 2).

Nói tóm lại, chỉ số H là một thước đo thành quả khoa học khách quan nhất so với các chỉ số hiện nay. Tuy chỉ số H vẫn còn vài khiếm khuyết, nhưng với sự chuẩn hóa (lấy ngành vật lí làm chuẩn), các cơ quan quản lí khoa học có một phương tiện, một thước đo có ích để phục vụ cho việc cung cấp tài trợ và đề bạt các nhà khoa học xứng đáng. Ứng dụng chỉ số H cũng là một cách đưa hoạt động khoa học nước ta từng bước hội nhập quốc tế.

Chú thích:

[1] Hirsch, J. E. (2005). "An index to quantify an individual's scientific research output," Proceedings of the National Academy of Sciences, 102(46):16569-16572, November 15, 2005 (có thể tải về miễn phí tại arXiv).

[2] Trong bài báo [1] Hirsch viết như sau: “From inspection of the citation records of many physicists, I conclude the following:

A value of m ≈ 1 (i.e., an H index of 20 after 20 years of scientific activity), characterizes a successful scientist.

A value of m ≈ 2 (i.e., an H index of 40 after 20 years of scientific activity), characterizes outstanding scientists, likely to be found only at the top universities or major research laboratories.

A value of m ≈ 3 or higher (i.e., an H index of 60 after 20 years, or 90 after 30 years), characterizes truly unique individuals.”

[3] Có thể sừ dụng ISI để tìm chỉ số H của bất cứ nhà khoa học nào, qua các bước sau đây: Truy cập trang ISI Web of Knowledge (www.isiknowledge.com), tìm “Web of Science”, chọn Advanced Search. Trong box này, gõ tiêu chuẩn tìm như tên nhà khoa học và địa chỉ hay quốc gia. Chẳng hạn như để tìm tác giả Sutherland RL ở viện Garvan thuộc, chúng ta gõ AU=Sutherland RL AND AD=Garvan AND CU=Australia. Sau đó ISI sẽ cho ra một danh sách tất cả các bài báo khoa học. Chọn “Citation Report” sẽ có chỉ số H và một số chỉ số khác của nhà khoa học.

[4] Iglesias JE, Pecharromen C. Scaling the h-index for different scientific ISI fields. Scientometrics 2007;3:303. Có thể tải bài này về từ website sau đây: http://arxiv.org/abs/physics/0607224.

[5] Braun T, Glanzel W, Schubert A. A Hirsch-type index for journals. The Scientist Nov 21, 2005; 22.

[5] Philip Ball. Achievement index climbs the ranks. Nature 448, 737 (16 August 2007) và phản hồi: Michael C. Wendl. H-index: however ranked, citations need context. Nature 449, 403 (27 September 2007). Philip Ball. "Index aims for fair ranking of scientists". Nature 436 (August 2005), và Wikipedia.



Bảng 1. Hệ số điểu chỉnh cho chỉ số H

Bảng 2. Chỉ số H của một số tập san khoa học hàng đầu




            ©  http://vietsciences.free.fr  và http://vietsciences.org Nguyễn Văn Tuấn

Thứ Tư, 18 tháng 5, 2016

Quên chất lượng Nhật Bản đi, bài viết này minh chứng sản phẩm của Đức mới là tốt nhất thế giới




Bạn có thể bàn luận với người Nhật Bản về giá thành sản phẩm, nhưng bạn sẽ bị gạt đi ngay nếu nói sản phẩm đắt hay rẻ với người Đức.

ớc Đức là nước bắt đầu nền công nghiệp hóa rất muộn, khi mà các cuộc cách mạng công nghiệp của Anh và Pháp thành công, nước Đức lúc bấy giờ mới đang là nước nông nghiệp. Người dân Đức sau thời kì công nghiệp hóa cũng chỉ học theo các công nghệ của Anh, Pháp và làm đồ giả. Vì lí do đó, Quốc hội Anh chú trọng đặc biệt cải cách "luật thương hiệu" vào ngày 23/8/1887, yêu cầu tất cả những gì nhập khẩu từ Đức phải có mác "Made in Germany". "Made in Germany" vào thời điểm bấy giờ là một nhãn mác bị mọi người khinh thường.
Các nghiên cứu khoa học của các trường đại học tại Đức trong thời kì đầu của thời đại công nghiệp hóa hoàn toàn không liên kết với các lĩnh vực sản xuất. Mặc dù nước lúc đó là Trung tâm khoa học của thế giới, nhưng người Mỹ lại thông minh hơn, những người Mỹ sau khi tốt nghiệp và lấy được bằng xong, họ đã không vùi đầu vào những nghiên cứu khoa học nữa, thay vào đó họ lăn mình vào đi làm với các doanh nghiệp luôn.