'23~24 대학일기

  • 홈
  • 자기소개
  • 태그
  • 방명록
  • '25 대학일기

2023년 2학기/AI음성인식 1

[과제] End-to-End 음성인식 시스템에 대한 심화이해

(작성일: 2023. 12. 3.) 서론 본고에서는 End-to-End 음성인식 시스템과 관련한 〈Listen, Attend and Spell〉 논문 및 후행 연구를 조사하였다. 또한 트랜스포머와 CNN을 결합한 컨포머(Conformer)에 관해서도 조사하였다. Listen, Attend and Spell 모델 Chan, W. 등은 음성 발화를 문자로 전사하는 뉴럴 네트워크 모델인 LAS(Listen, Attend and Spell)를 제시했다. 이 모델은 기존의 DNN-HMM 모델과 달리 음성 인식기의 모든 구성 요소를 함께 학습한다. LAS 모델은 크게 리스너(listener)와 스펠러(speller)로 구성된다. 리스너는 필터 뱅크 스펙트럼을 입력으로 처리하는 피라미드 구조의 순환 네트워크 인코더로..

2023년 2학기/AI음성인식 2024.04.12
이전
1
다음
더보기
프로필사진

서울사이버대학교에서 공부합니다.

  • 분류 전체보기 (71)
    • 성공적인 사이버 대학 생활을 위한 가이드 (1)
    • 2025년 1학기 (2)
    • 2024년 동계 (1)
      • AI음악제작 (1)
    • 2024년 2학기 (11)
      • 대학물리 (3)
      • 드론3D설계 (1)
      • 딥러닝 (1)
      • 라즈베리파이-사물인터넷실험 (2)
      • 뷰티크리에이터 (1)
      • 정신건강 (1)
      • 출판편집디자인 (0)
    • 2024년 하계 (1)
      • 드론모의조종 (0)
      • 기초전자공학 (0)
    • 2024년 1학기 (6)
      • 게임엔진(Unity) (1)
      • 머신러닝 (1)
      • 무기공학 (2)
      • 알고리즘 (0)
      • 우리안의글로벌이슈 (1)
      • AI영상인식실습 (1)
    • 2023년 동계 (2)
      • 문화로보는세계 (1)
      • 미술로보는창의적사고 (1)
    • 2023년 하계 (2)
      • 기계공학개론 (2)
      • 해부생리학 (0)
    • 2023년 2학기 (5)
      • 기초러시아어 (0)
      • 드론과인공지능 (0)
      • 드론설계기초 (1)
      • 로봇공학개론 (0)
      • 임상기초메이크업 (2)
      • AI음성인식 (1)
    • 2023년 1학기 (10)
      • 공학수학기초 (1)
      • 기초일본어 (2)
      • 드론공학개론 (0)
      • 삶과사색:인문학… (3)
      • 한자성어와퍼즐 (0)
      • 항공기상 (4)
    • 공모전 (5)
    • 프로젝트 (1)

Tag

CNN, 대드론, Unity, 드론, 파이썬, GPTS, 티스토리챌린지, 오블완, 로보마스터tt, 딥러닝, 프리미어프로, 유니티, 무인기, 챗GPT, 텔로, 드론프릭, 라즈베리파이, 계절학기, 서울사이버대학교, 영상편집,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Yong Choi. All rights reserved. 2024

  • 홈페이지

티스토리툴바