TOP
class="layout-aside-left paging-number">
본문 바로가기
[파이썬 Projects]/<파이썬 머신 | 딥러닝 & AI>

[머신러닝 프레임워크] Keras vs Tensorflow vs Pytorch

by 기록자_Recordian 2024. 9. 9.
728x90
반응형
머신러닝 프레임워크 Keras vs Tensorflow vs Pytorch 비교하기

 

문서 작업을 할 때 MS Word, 한컴 등 다양한 프로그램이나 툴처럼 AI 개발, 학습, 배포 후 운영 작업을 하는 과정에서 다양한 프레임워크를 활용할 수 있는데, 대표적으로는 Keras(케라스), Tensorflow(텐서플로우), Pytorch (파이토치)가 있다.

그전에, 머신러닝이라는 개념에 대해 알고 싶다면

 

[파이썬 머신러닝] 머신러닝과 생태계 이해

머신러닝의 개념 머신러닝은 일반적으로, 애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 예측하는 알고리즘 기법을 통칭한다.업무적으로 복잡한 조건/규칙들이

puppy-foot-it.tistory.com

 

프레임워크란,

개발 과정의 설계와 구현을 좀 더 편하게 해낼 수 있도록, 기존의 것을 재사용할 수 있게해주는 틀(프레임)이라고 보면 된다.


딥러닝 프레임워크란 응용프로그램을 개발하기 위한 여러 라이브러리나 모듈 등을 효율적으로 사용할 수 있도록 하나로 묶어 놓은 일종의 패키지라고 할 수 있다. 개발자가 중복적인 기능을 구현해야하는 소모적인 작업을 없애고 문제 해결을 위한 핵심 알고리즘에 집중할 수 있도록 도와주는 라이브러리의 집합이다.
 
딥러닝에서는 다양한 알고리즘(DNN, CNN, RNN, RBM, DBN 등)이 개발 되어 활용되고 있으며(딥러닝 알고리즘의 종류와 활용 참조), 여러 알고리즘을 결합하여 사용하는 경우도 많다. 이러한 알고리즘을 사용할 때마다 구현해야한다면 비효율적일 것이다. 이러한 문제를 해결하기 위해 사용하는 것이 딥러닝 프레임워크이다. 


★ 잠깐! MLOps, 모델옵스, 데브옵스 란? (출처: 위키백과)

 

MLOps 또는 ML Ops는 프로덕션 환경에서 기계 학습 모델을 안정적이고 효율적으로 배포하고 유지하는 것을 목표로 하는 패러다임이다. 이 단어는 "머신러닝"과 소프트웨어 분야 데브옵스의 지속적인 개발 관행의 합성어이다. 기계 학습 모델은 격리된 실험 시스템에서 테스트되고 개발된다.

알고리즘을 시작할 준비가 되면 데이터 과학자, 데브옵스 및 기계 학습 엔지니어 간에 MLOps를 실행하여 알고리즘을 프로덕션 시스템으로 전환한다. 데브옵스 또는 데이터옵스 접근 방식과 유사하게 MLOps는 자동화를 강화하고 프로덕션 모델의 품질을 향상시키는 동시에 비즈니스 및 규제 요구 사항에도 중점을 두고 있다.

MLOps는 일련의 모범 사례로 시작되었지만 ML 수명 주기 관리에 대한 독립적인 접근 방식으로 천천히 발전하고 있다. MLOps는 모델 생성(소프트웨어 개발 수명 주기, 지속적 통합/지속적 배포), 오케스트레이션 및 배포 통합부터 상태, 진단, 거버넌스 및 비즈니스 지표에 이르기까지 전체 수명 주기에 적용된다. 가트너에 따르면 MLOps는 모델옵스의 하위 집합이다. MLOps는 ML 모델의 운영화에 중점을 두고 있는 반면, 모델옵스는 모든 유형의 AI 모델의 운영화를 다룬다.

 

- 모델옵스

모델을 프로덕션에 배치한 후 기술 및 비즈니스 KPI를 포함한 일련의 거버넌스 규칙에 따라 결과 애플리케이션을 평가하고 업데이트하는 등 기업 전체에서 프로덕션에 있는 모든 모델의 모델 수명주기를 조율한다. 이를 통해 비즈니스 도메인 전문가는 데이터 과학자와 독립적으로 프로덕션에서 AI 모델을 평가할 수 있다

 

- 데브옵스

데브옵스(DevOps)는 소프트웨어의 개발(Development)과 운영(Operations)의 합성어로서, 소프트웨어 개발자와 정보기술 전문가 간의 소통, 협업 및 통합을 강조하는 개발 환경이나 문화를 말한다. 데브옵스는 소프트웨어 개발조직과 운영조직간의 상호 의존적 대응이며 조직이 소프트웨어 제품과 서비스를 빠른 시간에 개발 및 배포하는 것을 목적으로 한다.

 


1. Keras(케라스)

텐서플로의 문제를 해결하기 위해 보다 단순화된 인터페이스를 제공하는 케라스가 개발되었다. 케라스의 핵심적인 데이터 구조는 모델이다.

원래는 신경망 구축을 위한 고수준 API였으나 현재는 TensorFlow의 일부로 통합되었다 (tf.keras). 신경망 모델을 쉽게 구축하고 훈련할 수 있도록 사용자 친화적인 인터페이스를 제공한다. Keras는 신속한 실험과 프로토타입 제작에 적합하다.

케라스에서 제공하는 시퀀스 모델로 원하는 레이어를 쉽게 순차적으로 쌓을 수 있으며, 다중 출력 등 더 복잡한 모델을 구성할 때는 케라스 함수 API를 사용하여 쉽게 구성할 수 있다. 이처럼 케라스는 딥러닝 초급자도 각자 분야에서 손쉽게 딥러닝 모델을 개발하고 활용할 수 있도록 직관적인 API를 제공한다.

 

◆ 장점

케라스는 일반 사용 사례에 최적화된 간단하고 일관된 인터페이스를 제공한다. 사용자 오류에 대해 명확하고 실용적인 피드백을 제공하며, 케라스의 구성 요소는 모듈 형태로, 각 모듈이 독립성을 갖기 때문에 새로운 모델을 만들 때 각 모듈을 조합해 쉽게 새로운 모델을 만들 수 있다.

 

◆ 단점

모듈화의 한계로 복잡한 프로젝트에 구현 범위가 다소 좁은 편이다. 또한 케라스는 다양한 백엔드 위에서 동작하기 때문에 어떤 오류가 발생했을 때 케라스 자체의 문제인지, 백엔드 언어의 문제인지 특정하기 어려운 단점이 있다.


2. Tensorflow(텐서플로우)

Google에서 개발하여 2015년에 공개한 오픈 소스 프레임워크로, 기계 학습과 딥러닝을 위한 포괄적인 생태계를 제공한다. TensorFlow는 정적 계산 그래프를 사용하며, 대규모 생산 환경에서 효율적일 수 있다.

텐서플로는 가장 인기 있는 딥러닝 라이브러리 중 하나이다. 텐서플로우는 파이썬(Python) 기반 라이브러리를 이용하여 여러 종류의 CPU와 GPU, 다양한 플랫폼에서 사용가능하다. 기본 언어는 파이썬이지만, 다른 언어(C++, Java, Jula, JavaScript 등)로도 인터페이스에 접근 및 제어할 수 있다는 점 때문에 인기가 많다. 시간이 지남에 따라 광범위한 유저층을 보유하고 있다.

 

보다 자세한 내용은 이전에 작성했던 포스팅 확인

 

[머신러닝] 텐서플로우(TensorFlow)란?

텐서플로우(TensorFlow)란? 텐서플로우(TensorFlow)는 구글에서 개발한 오픈소스 머신러닝 프레임워크이다. 주로 딥러닝 모델을 만들고 학습시키는 데 사용되며, 다양한 플랫폼에서 실행이 가능하다.

puppy-foot-it.tistory.com

 

◆ 장점

텐서플로는 주로 이미지 인식이나 반복 신경망 구성, 기계 번역, 필기 숫자 판별 등을 위한 각종 신경망 학습에 사용한다.  특히 대규모 예측 모델 구성에 뛰어나 테스트부터 실제 서비스까지 사실상 거의 모든 딥러닝 프로젝트에서 범용적으로 활용할 수 있다.

무엇보다 구글에서 전폭적으로 지원하고 있기 때문에 지속적인 성능 개선과 지원에서 타 프레임워크보다 빠르고 안정적이란 부분이 강점이다. 이 밖에도 추상화 수준이 높아 텐서플로를 활용하면 개발자는 알고리즘의 세세한 구현보다 전체적인 논리 자체에 더 집중할 수 있게 되며 확장성 또한 뛰어나다.

 

◆ 단점

딥러닝 모델을 만드는 데 기초 레벨부터 직접 작업해야 하기 때문에 초보자가 사용하기 어려울 수 있다.


3. Pytorch(파이토치)

 

 

토치(Torch)는 페이스북의 AI 연구 팀이 개발한 파이썬 Torch 라이브러리 기반 오픈소스 머신러닝 라이브러리입니다. 파이토치는 토치(Torch)라는 머신 러닝 라이브러리에 바탕을 두고 만들어졌다. 파이토치는 텐서플로와 다르게 절차가 간단하고 그래프가 동적으로 변화할 수 있으며 코드 자체도 파이썬과 유사해 진입 장벽이 낮은 편이다.

연구와 개발에서 유연성과 사용 용이성으로 알려져 있으며, 동적 계산 그래프를 사용해 신경망 설계에서 더 많은 유연성을 제공한다.

파이토치에 대한 자세한 설명과 설치 방법은 하단 링크 참고

 

[머신러닝] Pytorch 설치하기 (Nvidia GPU 버전)

머신러닝에 적합한 도구: PyTorchPyTorch: 딥러닝 최적화 프레임워크PyTorch는 2016년에 출시된 딥러닝 프레임워크로, 신경망 모델 구축과 훈련에 특화되어 있다. 파이썬 기반으로 쉽게 배울 수 있고,

puppy-foot-it.tistory.com

 

◆ 장점

그래프를 만들면서 동시에 값을 할당하는 Define by run 방식으로 코드를 깔끔하고 직관적으로 작성할 수 있다. 또한 학습 속도도 텐서플로보다 빠르다. 텐서플로가 유기적을 신경망을 만들 수 없어 성능의 한계를 가지고 있는 반면, 파이토치는 메모리에서 연산을 하면서도 신경망 사이즈를 최적으로 바꾸면서 동작시킬 수 있다. 파이토치는 Numpy를 대체하면서도 GPU를 이용한 연산이 가능하며 유연하고 빠르기 때문에 최근 딥러닝 관련 논문에서는 텐서플로보다 파이토치를 선호하는 추세이다.

 

◆ 단점

텐서플로에 비해 사용자층이 낮고 학습에 필요한 자료와 예제를 구하기 쉽지 않다.

그러나 요즘엔 파이토치 커뮤니티가 활성화 되어 있어 비교적 수월해졌다.

https://pytorch.kr/

 

파이토치 한국 사용자 모임 (PyTorch Korea User Group)

파이토치 한국 사용자 모임에 오신 것을 환영합니다. 딥러닝 프레임워크인 파이토치(PyTorch)를 사용하는 한국어 사용자들을 위해 문서를 번역하고 정보를 공유하고 있습니다.

pytorch.kr


딥러닝 프레임워크 정리
출처: 한빛미디어 혼공학습단

 

  장점 단점
텐서플로(Tensorflow) 텐서보드(TensorBoard)를 통해서 파라미터 변화 양상이나 DNN의 구조를 알 수 있음 메모리를 효율적으로 사용하지 못함
케라스(Keras) 배우기 쉽고 모델을 구축하기 쉬움 오류가 발생할 경우 케라스 자체의 문제인지  backend의 문제인지 알 수 없음
파이토치(Pytorch) 간단하고 직관적으로 학습 가능
속도 대비 빠른 최적화가 가능
텐서플로우에 비해 사용자층이 얕음
예제 및 자료를 구하기 힘듦

[출처]

한빛미디어 혼공학습단

주식회사 텐 브런치 스토리

공학자 아빠의 배움과 유산:티스토리

 

728x90
반응형