머신러닝과 딥러닝의 차이, 텍스트 음성변환 기술 및 겐모델

2022년 02월 18일 by 도리포2
728x90
반응형

 '4차 산업혁명'시대에 디지털 전환 시 핵심이 되는 주제인  '인공지능' 영역에 포함되어 있는 머신러닝과 딥러닝의 차이에 대한 정의와, 딥러닝 기술 중에 대중에게 쉽게 이해되는 '텍스트 음성변환'  및 겐 모델 (GAN:Generative Adversarial Network)을 정리해 보겠습니다.

 

 


머신러닝과 딥러닝의 차이, 텍스트 음성변환 기술과 겐 모델

 '4차 산업혁명'시대에 디지털 전환 시 핵심이 되는 주제인  '인공지능' 영역에 포함되어 있는 머신러닝, 딥러닝에 대한 의미를 알아보고,

딥러닝 기술 중에 대중에게 쉽게 이해되는 '텍스트 음성변환'에 대한 이야기까지 정리해 보겠습니다.

 

 


4차 산업에서의 인공지능 영역

  인공지능 ( A.I :Artificial Intelligence )

'4차 산업혁명'이란 인공지능이 핵심 동력이 돼서 여러 가지 자동화와 연결성들이 극대화되는 산업혁명을 뜻합니다. 관련하여 필연적으로 수반되는  '디지털 전환'이 4차 산업혁명 시대에는 굉장히 급속도로 일어날 것이며, 디지털 기술의 놀라운 혁신의 전환점이 될 것입니다.


'디지털 전환'에는  현실 세계를 그대로 가상의 세계로 옮길 수 있는'가상 물리 시스템'이 도래를 예상할 수 있고, 이것을 이용하면, 현실에 있는 모든 정보를 가상에서 시뮬레이션을 하고 여러 가지 정보를 얻을 수 있기 때문에 미래에 다가오는 4차 산업혁명 시대의 핵심기술이라고 하는 것입니다.

그래서, 기업에서 이러한 '디지털 전환(트랜스포메이션)'에 대비해서, 디지털 활용 능력 '디지털 리터러시'를 높이는 데 주력을 하고 있는데, 그중에서 가장 중요시되는 기술이 바로 '인공지능'입니다. 

  지털 리터러시(digital literacy) : 디지털 플랫폼의 미디어를 접하면서 명확한 정보를 찾고, 평가하고, 조합하는 개인의 능력을 뜻한다


인공지능의 선두 주자 '앤드류 응 교수'는 인공지능은 미래의 새로운 전기와 갖게 될 것이다라고 얘기를 했는데, 그 이유는 전기가 100년 동안 우리 생활을 많이 바꿔놓은 것처럼, 인공지능은 몇 년 동안 굉장히 모든 산업을 전반적으로 바꿀 것이다라고 얘기를 하고 있습니다.

 

인공지능이라는 게 대체 무엇이길래 이렇게 많은 혁신을 가져온다고 했는데, 인공지능이란 무엇이냐고 하면, 인공지능이란 사고 또는 학습 능력을 가진 인간의 능력을 그대로 모사를 할 수 있는 어떤 프로그램 소프트웨어 기술을 말합니다. 

 

◈머신러닝

인공지능에 포함되는 기술로 '머신 러닝'이라고 하는 기술이 있는데, 그 기술은 기계가 학습한다라는 용어와 같이 학습을 통해서
어떤 결과를 향상하고 예측을 할 수 있는 알고리즘을 뜻합니다. 


'머신 러닝'  중에서 최근에 굉장히 주목받고 있는 '딥 러닝'이라고 하는 이 알고리즘은 퍼스트 트론이라고 하는 인간의 신경망을 모사하는 알고리즘입니다. 이 알고리즘을 다층으로 쌓아서 '다층 퍼스 토트론'이라고 하는 그 기술을 이용하는 알고리즘을 '딥러닝'이라고 합니다.

이 딥러닝들이 굉장히 복잡한 차원의 정보도 학습을 하고 그거에 대한 추론 결과를 낼 수 있어서  놀라운 결과들이 현대에 쏟아져 나오고 있습니다.

딥러닝
머신러닝과 딥러닝의 차이, 텍스트 음성변환 기술 및 겐모델

딥러닝

딥러닝'은 이미지 인식을 통해서 예를 들면 다양한 손글씨로 쓰인 필체들을 뭐라고 쓰여 있는지 그 내용을 확인할 수가 있고, 서로 다른 사람의 손글씨도 내용을 인공지능은 구분을 할 수가 있다는 것입니다. 흑백 사진에 색을 예측해서 정확하게 칠할 수도 있습니다.

개체들이 사진에 위치해서 어디에 위치하고 그 위치한 물체가 정확히 어떤 종류인지를 인식하는 데도 굉장히 능한 성능을 보이며, 또 그 물체를 위치를 대략적으로 중심점을 찾아내는 거가 아니라 그 물체를 픽셀 단위의 위치까지도 구분을 할 수가 있습니다. 


여러 가지 화가들의 화풍을 어떤 그림에다가 입혀서 새로운 그림을 생성을 해낼 수 있는 '겐 모델 '이라고 하는 그런 생성 모델도 있기 때문에 여러 가지 이미지를 합성해 내거나 생성해 낼 수 있는 능력도 보이고 있습니다.

  겐 모델((GAN:Generative Adversarial Network) : 단순히 결괏값을 도출해 내는 함수를 만드는 것을 넘어서 '실제적인 형태'를 갖춘 데이터를 만들어낸다는 것 (복잡한 이론으로 이 정도만 이해해도 됨)


공지능은 글자를 정말 사람이 내는 음성처럼 변환을 해주는 '텍스트 음성변환(텍스트 투 스피치)'라고 하는 인공지능 기술도 있습니다. 이 기술은 인공지능 스피커가 사람처럼 말을 하게 해 줄 수도 있고 또 '서피스트 텍스트'라고 하는 이 기술은 말을 이제 텍스트로 인식을 해서 사람이 하는 말을 그런 인공지능 스피커라든지 음성 인식 기술들이 이해를 할 수 있게 하는 그런 '음성 딥러닝'  종류들이 있습니다.

◈인공지능의 윤리적 문제

마이크로소프트 그리고 ibm 등에서 내놓았던 얼굴을 인식할 수 있는 '비전 딥러닝'이 백인보다 흑인 그리고 남성보다 여성에게 인식률이 떨어지는 결과를 보이는 예가 있었습니다. 남자보다 여자가 더 안 좋은 서비스를 받고 백인보다 흑인이 안 좋은 서비스를 받게 되는 편향적인 결과를 내는 딥러닝이 나왔던 이유는 서부권 그리고 남성의 데이터가 압도적으로 더 많았기 때문입니다. 데이터의 불균일성으로 딥러닝의 어떤 불평등한 결과를 초래를 한 경우라고 보입니다.


'트롤리의 딜레마'라는 것이 있는데, 자율 주행 자동차가 어떤 도로에서 양갈래 길이 있는데 그 양갈래 길에서 한쪽 길을 선택을 했을 때 이쪽에 있는 사람들을 죽여야 하고 또 다른 길을 선택을 했을 때 이쪽 길에 있는 사람들을 죽여야 할 때 이쪽 길에 있는 사람들의 삶의 가치가 더 큰지 이쪽 길에 있는 사람들의 삶의 가치가 있는지를 얘가 판단을 해서 어떤 길을 선택을 해야 되는데 그에 대해서 아직까지 딥러닝은 자율적으로 학습된 알고리즘에 따라서 판단을 하지 거기에 대한 윤리가 마련돼 있지 않다는 것입니다.


마무리

이상으로 디지털 전환 시 핵심이 되는 주제인  '인공지능' 영역에 포함되어 있는 머신러닝과 딥러닝의 차이에 대한 정의와, '텍스트 음성변환'  및 겐 모델 등에 대한 개략적인 내용을 알아보았습니다. 

 

인공지능 기술에도 윤리적인 문제가 포함될 수 있기 때문에, 윤리적인 가이드라인을 마련하는 등, 선결되어야 할 내용들이 있습니다. 끝.

 

728x90
반응형