CAFE

Q & A

교수님 Multi word units도 type token ratio 계산해도 될까요?^^

작성자Yenny Kwon|작성시간21.04.01|조회수128 목록 댓글 3

교수님 안녕하세요?^^

 

최근에 교수님 Asia Tefl에 내신 논문 꼼꼼히 읽으면서 ColloGram을 사용해 보았습니다^^

 

Collocations 추출하는데 너무나 훌륭한 도구라서 깜짝 놀라고 있어요!

 

다름이 아니라,  데이타(코퍼스) 사이즈가 다를때 ColloGram으로 분석한 결과 type/token ratio를 계산해도 될까

궁금해서 문의드립니다. 

 

많이 바쁘실텐데, 혹 시간이 되시면 답변 부탁드리겠습니다. 

 

감사합니다.  

다음검색
현재 게시글 추가 기능 열기

댓글

댓글 리스트
  • 작성자Dongkwang Shin | 작성시간 21.04.01 TTR은 그렇게 구함되는데 문제는 연어다양성이고 빈도수는 보통 normalization 하면됩니다 보통 per million으로 환산해요 데이터 사이즈가 1000단어고 연어 빈도가 20이라면 1000:20=1000000:? 식으로 이십 곱하기 백만을 천으로 나눔 per million이 계산됩니다 나름 그런 분석 프로그램으로는 세계 최대에 최초인데 많이 저평가되어 있어서 아픈 손가락같은 연구물입니다 써줘서 감사하죠
  • 작성자Dongkwang Shin | 작성시간 21.04.01 거기 탑재된 연어목록에서 선별기준 척도를 만들어 idiomatic expression만 골라 목록을 만들어도 좋은 연구가 될겁니다 등급별 %가 idiomatic한지 저도 궁금하네요
  • 작성자Yenny Kwon 작성자 본인 여부 작성자 | 작성시간 21.04.02 교수님 빠른 답변 정말 감사합니다! 콜로그램 개발하시면서 엄청 많은 시간투자와 수고가 있으셨을 것 같습니다. 조만간 더 알려지게 되면, 널리 사용되는 연어분석 툴이 될 것 같습니다. 교수님 좋은 프로그램 개발해주셔서 진심으로 감사합니다. 교수님 말씀하신 내용 하나씩 살펴보면서 더 공부하겠습니다. 좋은 주말 되세요! :D
댓글 전체보기
맨위로

카페 검색

카페 검색어 입력폼