빅데이터 러닝센터

로그인을 해주세요

Monthly Letter 7월 Monthly Leaf 🌿- BigTree Letter🌳

작성자관*자
작성일2024.07.08
조회수6,797
신고하기

인공지능 기술의 발전(1) – 인공신경망과 딥러닝의 출현 By. 정성원 센터장

안녕하세요. 빅데이터 러닝센터의 정성원 센터장입니다. 센터장 기고글을 통해 다양한 데이터 분석에 대한 내용을 다룰 예정입니다. 그 첫번째로 인공지능 기술의 발전에 대한 내용을 살펴보겠습니다.

여러분은 인공지능이란 단어를 들으면 무엇이 생각나십니까?
똑똑하고 유능한 아이언맨의 인공지능비서 자비스가 생각납니까?
아니면 인류를 몰살시키려 했던 터미네이터의 슈퍼인공지능 스카이넷이 생각나십니까?

인공지능이란 만물의 영장인 인간의 지적능력의 일부 또는 전체를 인공적으로 구현해 놓은 것을 뜻합니다. 인공지능은 유용한 도구로써 설계된 제한된 범위의 AI인 Narrow AI
아이언맨의 자비스, her의 사만다와 같이 인간과 같은 사고가 가능한 Strong AI
터미네이터의 스카이넷, 어벤져스의 Vision과 같이 인간보다 최소 1,000배 이상 뛰어난 Super AI로 구분해 볼 수 있습니다.

Narrow AI는 방대한 데이터를 학습하여 지능적인 행동이나 결정을 할수 있도록 구현된 컴퓨터 프로그램으로 특정한 작업에 대해서는 인간수준의 성능을 발휘하나 다른 작업에는 적용할 수 없습니다.

이세돌 9단을 이긴 알파고는 바둑은 잘하지만 다른 것은 할 수 없는것과 같습니다.

애플 Siri, 아마존 Alexa와 같은 음성인식시스템, 이미지분류시스템, 자율주행시스템, 추천시스템, 수요예측시스템, 고객행동예측시스템, 사기적발시스템은 모두 Narrow AI 범주에 들어간다고 볼 수 있습니다.

AGI(Artificial General Intelligence)는 아직 만들어지지 않았고 전문가들은 대체적으로 2047년경에 출현할 것으로 전망하고있습니다.

인공지능은 1950년대에 태동하였으며 3번의 중흥기와 2번의 암흑기를 거쳤습니다. 2번의 암흑기는 1970년대와 1990년대에 였습니다. 3번의 중흥기는 인공지능의 개념이 정립되었던 1950~1960년대에 한번, 인공신경망이 등장한 1980년대에 또 한번, 그리고 2010년대 딥러닝의 등장으로 시작된 3차 중흥기입니다. 2020년대 생성형AI의 등장으로 더욱 3차 중흥기가 발전하고 있습니다. 인공지능을 만드는 기술에도 많은 변화가 있었습니다.

1950년대에서 1980년대까지는 논리/규칙기반으로 인공지능을 만들었고 이를 전문가시스템이라 불렀습니다.1980~1990년대는 인공신경망을 통한 인공지능을 구현하였는데 1980년대에 인공신경망(Artificial Neural Network)이 출현하면서 인공지능의 2차 중흥기를 맞이하게 됩니다.

인공신경망을 충분히 학습시킬 컴퓨터파워가 부족하였고 훈련시킬 데이터가 부족하여서 1990년대 후반에 들어 두번째 암흑기를 불러왔다고 합니다.
1990~2010년대에는 정형데이터기반의 머신러닝에 의해 인공지능을 구현하였는데, 정답을 미리 알려주면서 학습시키는 방법으로 인공지능을 구현하였으므로 특징(Feature)의 설계의 능숙도에 따라 인공지능의 성능이 좌우하게 되었습니다.

2010년대 이후에는 빅데이터 기반 딥러닝에 의해 인공지능을 구현하고 있습니다

딥러닝은 사람이 일일히 특징(Feature)을 설계하지 않더라도 컴퓨터가 스스로 학습하여 특징(Feature)을 설계하므로 사람의 노력은 상대적으로 적게 들어가고 더 큰 컴퓨터 파워를 필요로 하게 되었습니다.

1986년에 출현한 인공신경망 알고리즘의 하나인 다층 퍼셉트론(MLP)은 인간 뇌 속 신경망을 흉내낸 컴퓨터 프로그램으로 인간의 뇌속의 신경망이 전기신호에 동작하는 것과 마찬가지로, 인공신경망은 데이터의 처리를 통해서 최적값을 찾아가는 프로그램이었습니다. 즉, 학습할 데이터와 이를 통해 생성된 인공신경망을 검증할 데이터가 필요한 것입니다. 따라서 데이터가 많고 학습 시키는 프로그램을 수행할 컴퓨터의 성능이 좋으면 좋을수록 성능이 우수한 인공지능을 만들 수 있다고 할 수 있습니다.

인공신경망은 학습을 통해 모델의 성능을 향상시킨다는 측면에서 머신, 즉 컴퓨터를 데이터를 통해 학습시킨다는 의미에서 머신러닝(Machine Learning)이라고 부르게 되었습니다. 이 머신러닝은 학습의 단계와 학습된 모델을 사용하는 예측의 단계로 나누어 볼 수 있는데, 학습의 단계는 충분한 데이터가 필요하고 학습하는데 소요되는 시간도 많이 필요하게 됩니다. 이렇게 생성된 모델에 새로운 문제를 제시하면 머신러닝 모델은 정답을 예측하게 되는 것인데, 컴퓨터파워가 증가된 현시점에서 예측은 순식간에 이루어 진다고 보면 됩니다.

알파고에게 데이터인 인간의 기보를 주고 학습시키는데는 많은 시간이 걸렸지만 이세돌 9단과 바둑을 둘 때는 제한된 시간내에 순간적으로 예측하여 바둑을 둘 수 있었던 것 과 같은 내용입니다.

미국에서 열리는 이미지 인식대회가 있었는데 이는 천개이상의 물체에 대한 백만개 이상의 이미지를 학습하여 모델을 만들고 얼마나 정확히 물체를 식별할 수 있는지를 겨루는 대회였습니다. 이 대회는 수년동안에 걸쳐서 진행되었지만 정확도 80%를 넘는 모델이 없어서 마의 80%라는 벽이 있었습니다. 2012년 캐나다 토론토대학교의 제프리 힌트 교수는 SuperVision이라는 팀을 이끌고 이 이미지 대회에 참가하여 마의 80% 벽을 허물고 당당히 84%의 정확도를 이루었고 이 팀이 사용한 인공신경망 알고리즘은 DBN(Deep Belif Nets) 이였습니다. 이는 인공신경망 알고리즘의 할아버지 격인 MLP를 딥하게 발전시킨 알고리즘이라 하여서 딥러닝(Deep Learning) 이라고 불리웠는데, 세부적으로는 심층신경망(Deep Neural Network, DNN), 합성곱 신경망(Convolutional Neural Network, CNN), 순환 신경망(Recurrent Neural Network, RNN), 제한 볼츠만 머신(Restricted Boltzmann Machine, RBN), 심층 .Q-네트워크(Deep Q-Networks) 등의 알고리즘이 있습니다.

딥러닝을 더욱 발전시킨 기업은 바로 Google이였는데, 구글은 딥러닝 기술을 적용하여 레이어 기반의 사진의 정보를 구체화하여 다양한 종류의 사진을 구분하여 낼 수 있었습니다. 구글포토에 1억명 이상의 이용자들이 올린 500억장이 넘는 사진들을 기반으로 각 피사체가 갖는 특징(Feature)을 알고리즘이 직접 판단하고 분류하고 사진에 담긴 정보를 이해하는 수준에 도달하게 되었습니다. 그래서 구글포토는 단순히 “개”가 아니라 “프렌치불독”이나 “옐로래브라도”를 입력해도 해당 사진을 찾아줄 정도가 되었습니다.

딥러닝은 다양한 영역에서 인간의 한계를 뛰어넘는 인공지능으로 발전하는 원동력이 되었습니다.

미국 스타트업기업 Enlitic은 각종 의학 영상자료를 토대로 환자의 암세포를 식별하고 5년 후의 생존율을 예측하는 Smart 의료기기를 개발하였는데, 이는 방사선 전문의 보다 더 정확하게 악성종양(암) 세포를 분류할 수 있다고 합니다. 유방암 판별의 경우 세포를 6642가지 유형으로 분류하여 이중에 암세포를 분류해 낸다고 합니다.

미국 스타트업기업인 Lapetus는 딥러닝을 적용하여 인간의 기대수명을 예측하고 이를 보험료 산정에 반영하였다고 합니다.

미국의 대표적인 빅테크 기업인 Microsoft 사는 2015년 딥러닝 알고리즘을 기반으로 화남,경멸, 역겨움, 두려움, 행복, 무감정, 슬픔, 놀람 등 8가지 감정을 분석하는 API방식의 AI 서비스 제공하였습니다만 2022년 6년 사생활침해 우려로 서비스 중단하였습니다. 이제 딥러닝을 통해 개발된 인공지능은 인간의 감정까지 인식하게 되었습니다.

to be continue...

센터장 기고글은 8월 Monthly Leaf에서 '인공지능 기술의 발전(2) – 벡터공간모델과 생성형 AI'로 이어집니다. 다음호에서 만나요!

지난 6월 24~25일 이틀동안 "GPT를 활용한 데이터분석" 신규 교육이 진행되었습니다.

총 58명이 신청하며, Chat GPT에 대한 큰 관심을 확인할 수 있었습니다.

진행된 교육의 설문 응답 결과를 확인해 보겠습니다.

'Chat GPT를 활용한 데이터분석' 과정을 진행해주신 이부일 강사님은 항상 높은 만족도를 보여주시는데요. 이번 과정도 역시나 높은 만족도를 보여주는 결과가 나왔습니다. 특히, 교육생과 소통을 중요시하는 강사님의 특징에 맞춰 상호작용, 교수법에서 높은 만족도를 보여주셨습니다😀

교육 목표/구성/활용도 등에서 4.7점으로 높은 만족도를 보여주었습니다. 다만, 실습 부분에서는 다소 낮은 만족도를 보여주었는데요. 이는 Chat GPT와 Python을 병행하는 과정의 특성상 Python 처음 접하시는 분들께서 Python 코드를 이해하는데 있어 약간의 어려움으로 인한 결과로 보입니다.😭

참가자분들은 특히 강사님의 전문성과 뛰어난 전달력이 높은 만족도를 이끌어냈으며, 이로 인해 Python 코드 작성 및 데이터 분석 능력을 크게 향상시킬 수 있었다고 평가하셨습니다. 실제로, 한 참가자는 이 교육을 "ChatGPT를 통해 Python 코드를 알 수 있고, Jupyter Notebook을 활용하여 정리된 데이터를 분석할 수 있어 초보자에게 큰 도움이 되었다"고 언급했습니다.

또한, "코드 자료가 공유되어 강의 후에도 연습 및 훈련해볼 수 있어 만족스럽다"는 의견도 있었습니다.

마지막으로, "강사님의 목소리가 귀에 쏙쏙 들어왔으며, 통계학과가 아니어서 어려웠던 통계 분석 모델들을 적절한 예를 들어가며 설명해주셔서 이해하는데 수월했다"고 평가되었습니다.

Chat GPT를 활용한 데이터분석 과정은 인기에 힘입어 7월 9~10일 (화~수) 추가 개설 되었습니다.

관심있는 분들은 적극적인 참여를 기다리겠습니다 😁

(7/9~10) Chat GPT를 활용한 데이터 분석 <자세히보기>

빅데이터 러닝센터에서 논문 작성 컨설팅을 시작합니다.

논문 컨설팅의 첫번째 시작을 김계수 교수님과 함께 하게되었는데요.

'김계수 교수의 구조방정식 모델링 논문 작성법' 과정입니다.

구조방정식 모델링 논문 작성 컨설팅은 사전 학습(VOD)를 시청 후 신청한 시간에 맞춰 교수님과 1:1 컨설팅을 진행하게 됩니다. 1:1 컨설팅에서는 신청자분들의 연구모델과 연구가설이 포함된 연구계획서 및 본인이 보유한 데이터를 지참하여 구조방정식 모델을 이용한 논문 작성 컨설팅이 진행됩니다.

또한 논문 작성 컨설팅에 도움을 드리기 위해 총 4개의 모듈을 준비하였으며, 희망 모듈을 선택하여 1:1컨설팅 시간을 더욱 효율적으로 이용하시면 되겠습니다.

각 잡고 준비한 구조방정식 모델링 논문 작성 컨설팅 과정을 통해 논문 작성에 어려움을 느끼신 분들이 조금이나마 쉽게 작성하시길 바라겠습니다. 🙏

SPSS 고급과정으로 8월 30일(금) 새롭게 개설된

'SPSS 매개회귀 조절회귀 분석 - PROCESS macro' 과정을 소개합니다.

사회과학 분야를 비롯한 여러 분야 논문 작성 시 많이 활용되는 매개회귀, 조절회귀 분석에 대해 SPSS PEOCESS macro를 통해 다양한 예시를 다뤄보며 보다 쉽게 사용법을 알려 드릴 예정입니다.

또한 실습에 앞서 매개회귀 조절회귀 분석방법의 개요 및 통계적인 이론 설명, 자세한 사례분석의 순서로 기초부터 탄탄하게 SPSS 매개회귀 조절회귀 분석 방법을 배우실 수 있습니다.

여러 교육과 프로젝트 경험을 통해 SPSS 사용자들이 겪는 고충을 이해하고 계시는 곽재민 박사님으로부터 논문에 필요한 매개효과 조절효과의 연구모형 수립과 분석방법에 대해 많은 노하우를 얻어 논문의 질을 향상시키는 좋은 기회가 되시기 바랍니다. 🖐️

오프라인 신청

온라인 Live 신청

'Python을 활용한 데이터 리터러시'

일시: 7/18~19 (목~금) 10:00 ~ 17:00

Python을 활용한 데이터 리터러시 과정에서는 Python 설치부터 프로그래밍 기초, 실전 프로젝트까지 모든 걸 배울 수 있어요. 데이터 수집, 가공, 분석, 시각화까지 실습하면서 데이터 분석 역량을 키워보세요. ChatGPT를 통해 중간중간 문제 해결도 도와드립니다. 데이터 리터러시 역량은 아무리 강조해도 지나치지 않아요. Python 초보자나 데이터 분석에 관심 있는 분들께 강력 추천드립니다!

'생성형 AI 시대에 역량을 키우는 의학/생물학 논문 작성'

일시: 7/24(수) 10:00 ~ 17:00

논문 작성이 부담스러운 의학/생물학 연구자분들을 위해 '생성형 AI 시대에 역량을 키우는 논문 작성법' 강의를 준비했습니다. 연구 결과의 설득력 강화, 논문 제출 및 발표 기술 향상, 생성형 AI 활용 사례를 배웁니다. 연구 주제를 사전 제출하면 맞춤형 교육이 가능해요. 초보 및 중견 연구자분들께 추천드립니다!

'AI·머신러닝을 활용한 빅데이터 모델링 With Python'

일시: 7/25~26(목~금) 10:00 ~ 17:00

Python으로 빅데이터 모델링을 배우고 싶으신가요? 'AI·머신러닝을 활용한 빅데이터 모델링 With Python' 강의를 소개합니다! 데이터 전처리부터 모델링까지, 머신러닝의 다양한 기법을 직접 실습해보세요.

기초 Python 지식이 있는 분들께 추천드리며, 의사결정나무, 신경망, 서포트 벡터 머신 등 최신 기술을 배울 수 있습니다. 데이터 분석 전문가나 머신러닝에 관심 있는 분들께 강력 추천합니다!

소개 이용약관 개인정보처리방침 환불규정 찾아오시는 길

(주)데이타솔루션 | 대표 : 배복태, 정교중
사업자등록번호 : 119-86-37009 | 통신판매업신고번호 : 2020-서울강남-02745호
주소 : (06101) 서울특별시 강남구 언주로 620, 10층(논현동, 현대인텔렉스) / 개인정보관리책임자 : 정성원
전화번호 : 02-3467-7200 | 팩스 : 02-852-3777 | 전자우편 :

Copyright (c) (주)데이타솔루션 All Rights Reserved.

호스팅 제공자: 주식회사 맑은소프트