[Application & Tips] Efficient Models

2021. 6. 10. 16:59·AI/Machine Learning
[TensorFlow] Lab-07-3-1 application and tips 모두의 딥러닝 시즌 2 정리...

시즌2 강의가 부실하다고 판단되어 시즌 1 lec 07-2: Training/Testing 데이타 셋 강의 내용 추가 정리

 

목차

  • Data sets
    • Evaluation using training set?
    • Training and Test sets
    • Trainig / Validation / Testing
  • Learning
    • Online Learning vs Batch Learning
    • Fine tuning
    • Efficient Models
  • Sample Data
    • MNIST / Fashion MNIST / IMDB / CIFAR-100

 


Efficient Models

 

 

실제 우리가 fine-tuning이라던지 여러 방법을 통해 모델을 만들었다고 할지라도 우리가 이 모델을 사용하기 위해서는 효율적인 모델을 만드는 것이 중요하다.

결국은 우리가 실제 만든 모델이 속도. 즉, 어떤 이미지를 분류한다고 했을 때 그 이미지를 분류하는 데 10초 라는 시간이 걸리면 사용이 불가능하다고 볼 수 있다.

 

예를 들어,

이미지 내 사람 100명을 분류하는 모델이 있다고 해보자. 그리고 이 이미지를 바라보는 카메라가 100대라고 한다면 이를 처리 연산은 100×100 = 10000. 즉, 1만번의 연산이 요구된다. 

하지만 실세계에서는 엄청난 연산량이 요구되며 이를 처리할 모델이 필요하게 된다.

 

결국엔 Inference time을 최소화하고 해당 모델의 weight 값을 경량화하는 것이 중요하다고 할수 있다.

 

따라서 우리는 fully connected layers 에 대한 파라미터 값이 굉장히 많다보니깐 이것을 1×1 convolution으로 대체하는 기법들이 많이 존재하며 결국 이런 기법들을 통해서 핸드폰에서 딥러닝을 돌리거나 대량의 처리를 위한 것들이 존재한다. 

 

 

 

 

 

 

'AI/Machine Learning' 카테고리의 다른 글
  • [Application & Tips] 학습 전략 - Transfer Learning / Fine Tuning / Feature Extraction
  • [Application & Tips] Online Learning vs Batch Learning
  • [Application & Tips] Data sets & Learning
  • [Application & Tips] Overfitting
s_y_130
s_y_130
  • s_y_130
    About SY
    s_y_130
  • 전체
    오늘
    어제
    • 분류 전체보기 (430) N
      • JAVA (54)
        • 더 자바 8 (0)
        • JAVA (41)
        • JAVA (JVM) (13)
      • Computer Science (86)
        • CS Basic (7)
        • OOP (11)
        • Design Pattern (16)
        • Network (8)
        • HTTP (6)
        • WEB (22)
        • OS (16)
      • DataBase (29)
        • DB theory (15)
        • MySQL (14)
        • Redis (0)
      • Collection Framework (1)
        • 구현 (1)
      • Data Structure (14)
        • Linear (9)
        • Non-Linear (5)
      • Algorithm (19)
        • Basic (12)
        • 응용 (2)
        • 완전 탐색(Brute Force) (1)
        • 다익스트라 (1)
        • Algorithm Problem (3)
      • Spring (103) N
        • 스프링 핵심 원리 - 기본편 (9)
        • 스프링 MVC 1편 - 백엔드 웹 개발 핵심 기술 (7)
        • 스프링 MVC 2편 - 백엔드 웹 개발 핵심 기술 (11)
        • 스프링 DB 1편 - 데이터 접근 핵심 원리 (6)
        • 스프링 DB 2편 - 데이터 접근 활용 기술 (10)
        • 스프링 핵심 원리 - 고급편 (13)
        • 스프링 부트 - 핵심 원리와 활용 (9)
        • Spring Security 6.x (2)
        • Spring Batch (1) N
        • Spring Cloud로 개발하는 MSA (1)
        • 재고시스템으로 알아보는 동시성이슈 해결방법 (4)
        • 개념 (27)
        • 테스트 (0)
        • Annotation (1)
        • Error Log (2)
      • TEST (0)
        • 부하 테스트 (0)
        • Practical Testing: 실용적인 테스트.. (0)
      • JPA (40)
        • 자바 ORM 표준 JPA 프로그래밍 (12)
        • 1편- 실전! 스프링 부트와 JPA 활용 (7)
        • 2편- 실전! 스프링 부트와 JPA 활용 (4)
        • 실전! 스프링 데이터 JPA (6)
        • 실전! Querydsl (6)
        • 개념 (5)
      • 백엔드 부트캠프[사전캠프] (35)
        • TIL (12)
        • 문제풀이 (23)
      • Open Source (0)
      • Book Study (1)
        • Morden Java in Action (1)
        • Real MySQL 8.0 Vol.1 (0)
        • TDD : By Example (0)
      • AWS (0)
        • EC2 (0)
      • git (2)
      • AI (22)
        • Machine Learning (17)
        • Deep Learning (0)
        • TensorFlow (1)
        • PyTorch (1)
        • YOLO (1)
        • Data Analysis (0)
        • Ai code Error (1)
        • Numpy (1)
      • MY (0)
      • WEB (15)
        • Django (3)
        • WEB 개념 (1)
        • React (1)
        • Maven (10)
      • Python (6)
      • 기초수학 (3)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
s_y_130
[Application & Tips] Efficient Models
상단으로

티스토리툴바