Text summarization with TensorFlow

textsum

출처: 구글 리서치 블로그

오늘 텐서플로우를 사용하여 글을 요약하는 모델에 대한 소개가 구글 리서치 블로그에 실렸습니다. 텐서플로우를 사용하여 seq2seq 방식으로 학습시켰고 현재 알려진 것 중에 가장 좋은 성능을 낸다고 합니다. 위 그림처럼 기사의 첫문단을 사용하여 기사의 헤드라인을 만들어내고 있네요. 사용한 데이터 셋은 Annotate English Gigaword를 사용했다고 합니다. 기사 헤드라인을 만드는 것으로 시작했지만 더 큰 텍스트의 내용을 요약하는 모델로 연구가 진행될 것으로 보입니다. 이 모델의 코드는 텐서플로우의 모델 깃허브에 공개되어 있습니다.

Text summarization with TensorFlow”에 대한 2개의 생각

    1. 로드홈 글의 글쓴이

      네 물론 가능할 것입니다. 아마 적절한 한글 데이터셋을 구하거나 만드는 일이 더 어려운 일일지 모르겠습니다. ^^

      좋아요

      응답

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

%s에 연결하는 중

This site uses Akismet to reduce spam. Learn how your comment data is processed.