fairseq: New SOTA of NMT

페이스북의 FAIR팀에서 블로그를 통해 기계번역에 대한 새 모델 fairseq를 공개하였습니다. 기계번역 분야에서는 리커런트 뉴럴 네트워크^{Recurrent Neural Network}가 정석처럼 사용되어 왔습니다만 최근에 콘볼루션 뉴럴 네트워크^{Convolution Neural Network}를 시퀀스 처리에도 사용되고 있습니다. fairseq는 콘볼루션 뉴럴 네트워크와 어텐션 메카니즘을 사용해 기계 번역에서 최고 성능^{state-of-the-art}을 갱신했다고 합니다. 블로그에서 콘볼루션이 단어 한개씩 처리하는 RNN 보다 훨씬 효율적으로 GPU를 사용할 수 있고 전체 문맥을 한꺼번에 조망하는 것이 사람이 번역하는 그것과 비슷하다고 주장합니다. 최근 구글의 NMT 결과와 비교했을 때 더 성능이 높으면서도 NVidia K40 GPU에서 무려 9.3배가 빠르고 GTX-1080ti 에서는 21배나 빠르다고 합니다.

fairseq의 토치 소스는 깃허브에 공개되어 있으며 영어-프랑스어, 영어-독일어, 영어-루마니아어에 대해서는 미리 학습시킨 모델을 제공합니다. 콘볼루션이 주류가 된다면 NLP 책들의 수정이 불가피 하겠네요. 🙂

“fairseq: New SOTA of NMT”에 대한 2개의 생각

Kwak Ji Won 2017-05-10 (5:55 pm)

CNN 이 비전분야뿐아니라 NLP (자연언어처리) 에도 많이 쓰인다는것은 어느 한 연구자가 NIPS 2015 를 보고 DL 의 10가지 트렌드 (http://codinginparadise.org/ebooks/html/blog/ten_deep_learning_trends_at_nips_2015.html) 에서도 언급한바 있습니다.
페이스북에서 그걸 실제로 보여준것 같습니다.

좋아요Liked by 1명

응답 ↓
1. 로드홈 글의 글쓴이2017-05-10 (5:58 pm)
  
  오, 일찍이 조짐이 있었군요. 좋은 정보 감사드립니다. ^^
  
  좋아요좋아요
  
  응답 ↓

	박해선 (Machine Learning with Python C…)
	코린이 (Machine Learning with Python C…)
	박해선 (“머신 러닝 교과서: 파이토치 편…)
	책구매자 (“머신 러닝 교과서: 파이토치 편…)
	박해선 (Machine Learning with Python C…)
	ddddd (Machine Learning with Python C…)
	박해선 (Essential Math for Data Scienc…)
	dk kkk (Essential Math for Data Scienc…)
	이시은 (About Me)
	박해선 (About Me)
	이시은 (About Me)
	박해선 (Essential Math for Data Scienc…)
	DDDD (Essential Math for Data Scienc…)
	박해선 (About Me)
	izowooi (About Me)

텐서 플로우 블로그 (Tensor ≈ Blog)

머신러닝(Machine Learning), 딥러닝(Deep Learning) 그리고 텐서(Tensor) 또 파이썬(Python)

fairseq: New SOTA of NMT

“fairseq: New SOTA of NMT”에 대한 2개의 생각

댓글 남기기 응답 취소

이 글 공유하기:

관련

“fairseq: New SOTA of NMT”에 대한 2개의 생각

댓글 남기기 응답 취소