[데이터 과학, 인공 지능, 기계 학습, 딥 러닝] 이제는 제대로 알아봅시다!

프리모아_IT기술파트너

2020. 7. 3. 12:12

현재, IT시장은 데이터 과학, 인공 지능, 기계 학습, 딥 러닝 같은 단어들이 일상적으로느껴질 만큼 많이

사용됩니다. 지금부터 여러분께 4차산업 혁명에 대비하여 필수로 알아야하는 4가지 중요 기술에 대한

이야기를 해드리려 하니 꼭 끝까지 읽어 주시면 많은 도움이 되실 것입니다.

데이터 과학

데이터 과학은 데이터에 관한 학문입니다. 데이터 과학이 비즈니스의 많은 결정을 내리는데 사용되기도 한다는 것을 알고 계셨나요?

모든 기술 분야 회사들은 방대한 양의 데이터를 수집하고 데이터들은 수익으로 이어집니다. 이는 데이터 과학의 영향 때문이라고 할 수 있습니다. 데이터가 많을수록 더 많은 비즈니스 인사이트를 얻을 수 있게 됩니다. 데이터 과학을 통해 기존에는 몰랐던 새로운 패턴을 발견할 수 있기도 합니다. 예를들어, 뉴욕으로 휴가를 떠난 남성은 3주 뒤 베니스로 럭셔리 여행을 갈 확률이 높다고 데이터 과학은 분석하고 이는 럭셔리 이색테마 전문 여행사에게 유익한 정보로 전달되어 위 남성분을 고객으로 유치하고자 할 것입니다.

데이터 과학은 위와 같은 사례에서 볼 수 있듯이 광범위하게 쓰이고 있습니다. 기업은 데이터 과학을 추천 알고리즘을 생성하기 위해 사용하기도 하고 이용자의 행동 패턴을 분석하는데 쓰기도 합니다. 단 충분한 양의 데이터를 필요로 하고 충분한 양의 데이터가 있다면 다양한 알고리즘을 데이터에 적용 가능하기 때문에 보다 정확한 결과를 얻을 수 있습니다.

데이터 과학에는 규범적 분석이라는 개념이 있습니다. 위에서 예로 든 럭셔리 투어 사례가 데이터 과학의 예시라면 규범적 분석은 추가적으로 베니스에서 어떤 럭셔리 여행을 떠날 것인지 종류까지 구체적으로 예측하는 것을 의미합니다. 비행기는 1등석을 원하지만 숙소는 3성급으로도 만족하는 고객이 있는가 하면 비행기 이코노미석도 상관없지만 최고급 숙소를 원하고 문화 체험을 원하는 고객이 있습니다. 같은 럭셔리 투어 수요자지만 자세히 보면 다른 요구사항이 있습니다. 이에 대해 처방적 분석을 내리는 것이 규범적 분석의 역할입니다.

이는 마치 인공 지능의 역할과도 유사하게 들리기도 하는데, 이는 인공 지능으로 방대한 데이터 속에서 알고리즘을 찾아내는 것도 데이터 과학의 일부이기 때문입니다. 머신 러닝은 데이터 과학에서 예측 및 데이터 패턴 발견에 사용됩니다. 이는 시스템에 인공 지능을 넣어주면서 진행됩니다.

인공 지능

인공 지능, 줄여서 AI라고 하는데 1950년대 중반에 처음 출시됐습니다. 그러나 이목이 집중된 시기는 비교적 최근으로 인공지능이 처리 능력이 발전한 이후입니다. 1900년대를 돌아보면 AI를 실현하는 데 필요한 컴퓨터 기술 자체가 없었습니다. 오늘날은 일상 속에 인공지능이 많이 녹아 들었는데 지금 이 글을 스마트폰이나 상용 하드웨어, 컴퓨터 등에서 읽을 수 있는 것도 알고리즘 실행능력이 많이 개선된 덕분입니다. 또 AI의 가능성이 무궁무진해 보이기 때문에 AI에 대한 수요가 높습니다.

인공 지능이란 정확히 무엇일까요? 인공 지능은 컴퓨터를 통해 기계가 데이터를 이해하고, 데이터를 통해 배우고, 데이터에 숨겨진 패턴을 기반으로 의사 결정을 내리거나, 인간의 능력으로 직접 하기에는 어렵거나 거의 불가능한 결론을 도출해 내는 능력을 기계가 갖추는 것입니다. AI는 기존에 작동하던 데이터가 아닌 새로 입력한 지식을 활용하는 능력을 갖고 있습니다.

AI를 정의하는 또 다른 개념은 수학적 알고리즘의 모음으로 컴퓨터가 다른 타입과 조각 간의 데이터의 관계를 잘 이해하고 지식을 연결해 실용적으로 결론을 내리거나 고차원적으로 정확한 결정을 내리도록 도와줍니다.

주의사항은 AI가 습득할 만한 데이터가 충분해야 합니다. 만약 AI모델에게 적은 양의 데이터만을 가지고 있으면 이후 AI의 예측능력 및 결정능력의 정확성이 떨어지게 됩니다. 데이터가 많으면 많을수록 AI모델 트레이닝에는 더 효과적이고 정확한 결과가 나옵니다. 데이터의 크기에 따라서 당신은 AI모델에게 적합한 알고리즘을 다양하게 선택할 수 있습니다. 그리고 이것이 머신 러닝, 딥 러닝의 시초가 됩니다.

AI가 등장했을 초기에는 신경 네트워크가 주름잡던 시기였습니다. 하지만, 당시 컴퓨터 하드웨어의 한계로 AI는 발전하지 못하는 시기였습니다. 이후 1980년 후반부터 2010년대까지 머신 러닝이 인기를 끌기 시작했습니다. 당시 TECH 업계의 대기업들이 머신 러닝에 크게 투자했고 구글이나 아마존, IBM, 페이스북 등은 AI와 ML PhD. 인적 자원들을 대학시절부터 발굴해 경영하고 있었습니다. 그러나 오늘날은 머신 러닝의 시대도 지나간 것 같고 요즘은 딥 러닝이 대세가 되었습니다. 지난 수 년간 이런 식으로 AI의 진보가 이루어져왔으며 매년 그 수준은 더 올라가고 있습니다. 아래 이미지를 통해서 시각 자료로 더 정확하게 확인하실 수 있습니다.

[ 수 많은 조각 데이터가 상호작용하여 최적화된 하나의 결론으로 도달합니다. ]

기계 학습

이번에는 기계 학습에 대해서 이야기해보도록 하겠습니다. 기계 학습 (ML)이란 AI의 하위 단계로 ML은 AI의 구현이라고 말할 수도 있습니다. 즉 AI의 개념을 떠올릴 때마다 ML의 개념을 적용 할 수 있습니다. 이름에서부터 알 수 있듯이 ML은 기계가 사람들이 제공하는 방대한 양의 데이터를 습득하고 시스템에 스트리밍 되는 새로운 데이터에 적용하는 시스템입니다.

기계를 학습시키는 방법에는 여러가지가 있습니다. 지도 학습, 비지도 학습, 반지도 학습 및 강화 기계 학습 등이 있는데요. 이 중 몇 가지는 사용자가 기계에게 개체 또는 독립 변수 즉, 입력 값을 알려주고 출력 값으로 종속 변수가 나오게끔 합니다. 그 과정 속에서 기계는 전달받은 데이터 내 독립변수와 종속변수의 관계에 대해 정보를 얻게 됩니다.

이 때 데이터를 트레이닝 세트라고 부릅니다. 그리고 한 단계의 학습 또는 교육이 종료되면 기계나 ML 모델은 또 새로운 데이터를 테스트하게 됩니다. 여기에는 데이터 값을 트레이닝 데이터 용도와 테스트 용도의 데이터로 나누는 방법이 있습니다. 모델이 신뢰도가 높고 정확한 결과를 줄 만큼 업그레이드됐다면 모델은 제품 설정에 데 새로운 데이터 기반으로 문제 해결 및 예측 그리고 분류하는 역할을 수행하게 됩니다.

ML에는 예측, 분류, 회귀 등에 사용되는 다양한 알고리즘이 있습니다. 단순 선형 회귀, 다항식 회귀, 지원 벡터 회귀, 의사 결정 트리 회귀, 임의의 포리스트 회귀, K- 최근접 이웃 등이 그 예 입니다. 이것들은 ML에 사용되는 일반적인 회귀 및 클러스터링 알고리즘의 일부이며 더 많은 알고리즘이 존재합니다. ML 모델 교육 전에는 데이터를 준비해야 할 것도 많고 사전 과정 진행도 신경을 써 주어야 할 것도 많습니다.

다만 SciKit Learn과 같은 ML 라이브러리 같은 최신식 도구는 수학이나 통계에 대한 배경 지식이 없는 앱 개발자도 사용할 수 있고 공식 AI 교육을 이같은 라이브러리를 통해 ML 모델 빌드, 교육, 테스트, 배포와 사용을 현실에서 할 수 있습니다. 이러한 알고리즘의 작동 방식을 알아 두는 것이 언젠가는 도움이 됩니다. 문제 설명에 대한 알고리즘을 선택할 때 정보에 근거한 결정을 내릴 수 있게 됩니다.

딥 러닝

딥 러닝 (DL)은 ML의 발전된 버전입니다. ML은 대부분의 응용 분야에서 매우 유용하지만 ML으로는 부족한 상황이 있습니다. 이 때 딥 러닝이 필요합니다. 보편적으로 교육 데이터 세트 크기가 상대적으로 작으면 ML을 사용하는 것이 좋다는 인식이 있습니다. 그러나 모델이 학습하는 데이터 양이 방대하거나 데이터에 너무 많은 기능이 있고 정확도가 특히 중요하다면 딥 러닝을 사용하는 것이 좋습니다.

딥 러닝에는 성능이 좋은 하드웨어를 써야 하며 대부분 GPU를 사용합니다. 모델 학습에 훨씬 더 많은 시간이 걸리며 ML에 비해 일반적으로 실행 측면에서는 더 어렵다는 점에 유의해야합니다.

TensorFlow에구글에서 많이 쓰고 개발자들에게 강조하는 신경 네트워크입니다. 즉, 일종의 딥 러닝 모델이기 때문에 딥 러닝을 사용하고 있다고 볼 수 있습니다. 얼마 전 세상에 나온 자동 운전 차량 또한 딥 러닝의 산물이라고 볼 수 있습니다. 이 밖에도 현대 사회에는 이런 딥 러닝 응용 프로그램이 많습니다. 예를 들어 Netflix와 같은 엔터테인먼트 서비스는 딥 러닝을 시스템 개선을 위해 넓은 범위로 이용해서 추천기능을 넣었고 사용자들의 데이터를 기반으로 지속적으로 제작할 가치가 있는 프로그램을 파악하고 돈과 시간 낭비를 줄이기 위해 어떤 프로그램에 투자를 줄여야 하는지도 파악을 합니다.

Alexa 및 Google Assistant 등의 오늘날의 많은 가상 어시스턴트는 딥 러닝을 사용하여 요청사항 (Natural Language Processing - NLP), 톤, 감정 표현을 이해하고 몇몇 사례는 목소리로 진위여부를 확인하기도 합니다. 가짜 뉴스는 오늘날 큰 문제가 되는 것 중 하나입니다. 소셜 플랫폼에서 가짜 뉴스가 확산되는 것을 통제하지 못한 것에 대해 회사들이 고소당한 사건이 있었습니다. 그로 인해 많은 회사들이 딥 러닝을 통해 회사 플랫폼에서 허위 뉴스 항목을 찾아 적절한 조치를 취했습니다. 이런 사례만 보더라도 딥 러닝은 현 사회에서 중요하다는 것을 알 수 있습니다.

위 글에서 언급했던 기술들에 대해 할 수 있는 이야기는 훨씬 많습니다. 이는 수천 명의 사람들이 인생을 바쳐 연구하고 인류의 발전을 위해 이러한 기술을 개발한 결과이기 때문에 광범위한 주제가 될 수밖에 없습니다. AI의 발달이 인류의 멸망의 길이라고 생각하는 사람들도 있습니다. 그러나 아무도 다가오는 미래는 알 수 없고 시간여행까지 할 만큼 기술이 발달하지 않았습니다. 언젠가는 시간 여행을 할 수 있을 만큼 강력하고 지능적인 디자인으로 출시된 AI도 볼 수 있을 지 모릅니다.

작금에는 이 과감한 신기술을 받아들이고 더 나은 세상을 만들기 위해 어떻게 활용을 해야 하는지 잘 생각해 보아야 합니다. 의료 기관에서 AI를 사용하여 질병을 조기에 발견하고 생명을 잃는 것을 미연에 방지하는 법을 연구하는 많은 조직과 민간 기업이 있습니다. AI가 암 치료 역할을 하는 것에 대한 많은 연구가 진행되고 있습니다. 사람들은 혁신적인 새로운 약물을 발견을 통해 치료의 문을 넓히려고 합니다. 의료 영상 등도 AI가 많이 사용되는 분야입니다. 사람들이 의료 이미징을 위해 GPU 코어와 함께 AI를 사용하고 (딥 러닝) 이미지 분석도 AI를 사용하여 수행되기 때문에 질병의 조기 발견, 정확한 질병의 발견 및 생명을 위협하는 질병을 피하기위한 적절한 조치를 취할 수 있게끔 의료산업이 발전했습니다.

금융 산업에서는 AI를 통해금융 거래에서 사기를 감지하고 있습니다. Keras와 TensorFlow의 증식으로 사기 탐지 및 예방에 대한 새 기능을 엿볼 수 있습니다. 은행 및 금융 기관은 거래, 은행 이력 및 수백만 명의 신용 점수를 연구하여 대출 및 보험 사기가 발생하는 것을 감지하고 방지할 수 있습니다. 이는 지난 몇 년 동안 수십억 달러가 절약되는데 기여하였습니다. 인공 지능과 자율 주행 자동차 기술의 혁신 덕분에 로봇이 조종하는 호화스러운 미래가 현실화되고 있습니다. 또한 앞으로는 건강과 신체의 다양한 매개 변수를 모니터링하는 집에서 보관할 수 있는 크기로 최신 스마트폰 만한 소형 기기를 갖게 될 것입니다. 이미 혈당과 혈압 모니터는 모니터링 기술을 가지고 있으며 최신 Apple Watch에는 ECG 리더가 있습니다. 기술과 스마트 기기의 발전으로 건강에 관한 충분한 데이터 제공으로 건강 체크를 하며 건강상의 일정 패턴을 발견을 통해 앞으로 일어날 일을 예측할 수 있어 미리 건강관리 방향을 수정하고 설정할 수 있습니다.

위에서 언급한 기술 중 “인공지능”과 “빅데이터”에 관심이 있으신분 아래 프리모아에서 소개한 링크를 공유 드리겠습니다. 해당 컨텐츠는 프리모아에서 작성된 글로, 위 언급한 내용외에 응용정보를 소개해드리니 방문해보시면 좋을 것입니다.

‘프리모아’는 작업을 의뢰하는 클라이언트와 작업을 수행하는 파트너스를 연결하는 IT 전문가 중개 플랫폼입니다. 위 언급된 기술에 능숙한 7만여명의 검증된 개발자와 디자이너를 신속하고 쉽게 만나보실 수 있습니다.

외주 의뢰 및 활동을 원하시면 하단의 배너를 클릭해보세요!

저작자표시 (새창열림)

[데이터 과학, 인공 지능, 기계 학습, 딥 러닝] 이제는 제대로 알아봅시다!

Recommended for You

티스토리툴바