This site uses cookies.
Some of these cookies are essential to the operation of the site,
while others help to improve your experience by providing insights into how the site is being used.
For more information, please see the ProZ.com privacy policy.
Jan 17, 2020 (posted viaProZ.com): Currently working on some reports on the automotive industry, English to Korean, 58,000 words. I hope to get it finished until the next week....more »
This person has a SecurePRO™ card. Because this person is not a ProZ.com Plus subscriber, to view his or her SecurePRO™ card you must be a ProZ.com Business member or Plus subscriber.
Affiliations
This person is not affiliated with any business or Blue Board record at ProZ.com.
English to Korean: Speech and Language Processing by Dan Jurafsky and James H. Martin General field: Tech/Engineering Detailed field: IT (Information Technology)
Source text - English Chapter 4: Naive Bayes and Sentiment Classification
Classification lies at the heart of both human and machine intelligence. Deciding what letter, word, or image has been presented to our senses, recognizing faces or voices, sorting mail, assigning grades to homeworks; these are all examples of assigning a category to an input. The potential challenges of this task are highlighted by the fabulist Jorge Luis Borges (1964), who imagined classifying animals into:
(a) those that belong to the Emperor, (b) embalmed ones, (c) those that are trained, (d) suckling pigs, (e) mermaids, (f) fabulous ones, (g) stray dogs, (h) those that are included in this classification, (i) those that tremble as if they were mad, (j) innumerable ones, (k) those drawn with a very fine camel’s hair brush, (l) others, (m) those that have just broken a flower vase, (n) those that resemble flies from a distance.
Many language processing tasks involve classification, although luckily our classes are much easier to define than those of Borges. In this chapter we introduce the naïve Bayes algorithm and apply it to text categorization, the task of assigning a label or category to an entire text or document.
We focus on one common text categorization task, sentiment analysis, the extraction of sentiment, the positive or negative orientation that a writer expresses toward some object. A review of a movie, book, or product on the web expresses the author’s sentiment toward the product, while an editorial or political text expresses sentiment toward a candidate or political action. Extracting consumer or public sentiment is thus relevant for fields from marketing to politics.
The simplest version of sentiment analysis is a binary classification task, and the words of the review provide excellent cues. Consider, for example, the following phrases extracted from positive and negative reviews of movies and restaurants. Words like great, richly, awesome, and pathetic, and awful and ridiculously are very informative cues:
+ ...any characters and richly applied satire, and some great plot twists
- It was pathetic. The worst part about it was the boxing scenes...
+ ...awesome caramel sauce and sweet toasty almonds. I love this place!
- ...awful pizza and ridiculously overpriced.
Spam detection is another important commercial application, the binary classification task of assigning an email to one of the two classes spam or not-spam. Many lexical and other features can be used to perform this classification. For example, you might quite reasonably be suspicious of an email containing phrases like "online pharmaceutical" or "WITHOUT ANY COST" or "Dear Winner".
Translation - Korean 제4장. 나이브 베이즈 및 감정 분류
분류(classification) 행위는 인간 지능과 기계 지능의 핵심에 있다고 할 수 있다. 우리의 눈에 보이는 문자, 단어, 이미지가 무엇인지 파악하고, 얼굴이나 목소리를 인식하고, 메일을 분류하고, 숙제에 성적을 매기는 등의 행위는 모두 특정 입력에 대해 범주를 부여하는 작업이다. 이러한 분류 작업에는 애로 사항이 발생할 수 밖에 없는데, 이는 아르헨티나의 우화 작가인 호르헤 루이스 보르헤스(1964)가 다음과 같이 동물을 분류하고자 시도했던 것에서 잘 드러난다.
(a) 황제가 소유한 동물, (b) 방부처리 한 동물, (c) 훈련된 동물, (d) 새끼 돼지, (e) 인어, (f) 근사한 동물, (g) 떠돌이 개, (h) 이 분류 체계에 포함된 동물, (i) 미친듯이 몸을 떠는 동물, (j) 수를 헤아릴 수 없는 동물, (k) 고급 낙타털 브러시로 그린 동물, (l) 기타, (m) 방금 꽃병을 깨버린 동물, (n) 멀리서 볼 때 파리 같이 생긴 동물
많은 언어처리 작업에는 분류 작업이 포함된다(다행히도 언어처리와 관련한 분류 범주는 보르헤스의 분류 체계보다는 정의하기가 훨씬 간단하다). 이 장에서는 나이브 베이즈 알고리즘을 소개하고, 이를 라벨이나 범주를 전체 텍스트 또는 문서에 부여하는 작업인 텍스트 분류(text classification) 작업에 적용해 본다.
저자는 잘 알려진 텍스트 분류 작업인 감정분석(sentiment analysis)에 초점을 맞출 것이다. 감정분석이란 특정 대상에 대한 저자의 긍정적/부정적 태도를 파악함으로써 그 ‘감정’을 추출해 내는 작업이다. 웹상에 존재하는 영화평, 도서평, 제품에 대한 평가에는 해당 대상에 대한 저자의 감정이 드러나고, 신문 사설이나 정치에 관한 글에는 특정 후보자나 정치적 행동에 대한 감정이 드러난다. 따라서, 소비자의 감정이나 여론 감정을 추출해 내는 작업은 마케팅에서 정치에 이르는 분야에 중요하게 활용될 수 있다.
가장 간단한 수준의 감정분석은 이진분류(binary classification) 작업으로서, 리뷰에 포함된 단어들을 훌륭한 단서로 활용할 수 있다. 예를 들어, 영화와 식당에 대한 리뷰에서 추출한 긍정/부정적인 문장들을 살펴보면, 훌륭한(great), 멋들어지게(richly), 기막힌(awesome), 한심한(pathetic), 형편없는(awful), 터무니없는(ridiculously)과 같은 단어들은 저자의 감정을 효과적으로 파악할 수 있는 좋은 단서가 된다.
+ … 캐릭터와 풍자를 멋들어지게 연출했고, 몇몇 반전이 훌륭했다.
- 한심할 정도였다. 최악이었던 건 복싱 장면이었다…
+ …기막힌 카라멜 소스와 달달하고 토스티한 아몬드. 이 집 진짜 좋아요.
- …형편없는 피자에 터무니없는 가격.
스팸 메일 탐지(spam detection) 또한 상업적으로 응용할 수 있는 중요한 분류 작업으로서, 이메일을 스팸 메일 및 비 스팸 메일이라는 두 가지 클래스 중 하나로 분류하는 이진분류 작업이다. 분류를 위해 다양한 단어와 자질(feature)을 활용할 수 있는데, 예를 들어 ‘온라인 약국(online pharmaceutical)’, ‘완전 무료(WITHOUT ANY COST)’, ‘당첨되셨습니다(Dear Winner)’ 같은 문구가 포함된 이메일은 그 스팸 여부를 충분히 의심해 볼만하다.
More
Less
Experience
Years of experience: 7. Registered at ProZ.com: Oct 2016.
With 3 years of experience in providing high-quality translation services, I believe that I would be perfect for your English -> Korean translation job.
Specializing in IT, technology in general, and environment
Profile
Native Korean speaker providing translation of English into Korean
Majored linguistics and minored English literature
Knowledge in natural science, engineering and computer science
A freelance programmer specializing natural language processing.
Experience
Served as an interpreter/translator for Republic of Korea Navy in an oversea dispatch to the Gulf of Aden in 2013.
Participated in a group project which translated a book Dickinson et al, 2012, “Language and Computers”, Wiley-Blackwell into Korean.
Translated various ISO/IEC standards and user manuals into Korean. (More than 1M words)
Translated various environment-related documents including Basel, Stockholm, Rotterdam and Minamata Conventions into Korean. (More than 400K words)
Translated numerous IT-related documents and subtitles into Korean. (More than 200K words)
Programmed an Android app, a web page and various C++/python console programs.
CAT Tool and Software
Proficient in SDL Trados Studio, Memsource, Microsoft Word, Excel and PowerPoint
Keywords: english, korean, technology, ICT, localization, market trend, 한국어, 영어, 기술, 정보기술. See more.english, korean, technology, ICT, localization, market trend, 한국어, 영어, 기술, 정보기술, 현지화, 시장 동향. See less.