본문 바로가기
인공지능 (AI)

퍼셉트론이란? 다층퍼셉트론? 딥러닝? 쉬운 설명

by 뉴디라 2023. 4. 13.

1. 퍼셉트론(Perceptron)이란?

  • 퍼셉트론은 인공신경망의 일종으로, 입력값과 가중치를 곱한 결과를 활성화 함수를 거쳐 출력값을 계산하는 모델입니다.
  • 퍼셉트론은 분류(Classification) 문제를 해결하는데 주로 사용됩니다.
  • 퍼셉트론은 단층 퍼셉트론과 다층 퍼셉트론으로 나뉩니다.
  • 단층 퍼셉트론은 하나의 출력값만을 가지며, 입력값과 출력값 사이의 가중치를 조절하여 학습합니다.
  • 다층 퍼셉트론은 여러 층의 뉴런으로 구성되며, 입력층과 출력층 사이에 여러 개의 은닉층(hidden layer)이 존재합니다.

 

 

 

2. 퍼셉트론의 동작방식

퍼셉트론 동작방식

  • 퍼셉트론은 입력값(Inputs)과 가중치(weights)를 곱한 결과를 모두 더한 후, 활성화 함수(Activation function)를 거쳐 출력값을 계산합니다.
  • 이진 분류 문제에서는 보통 활성화 함수로 계단 함수(Step Function)를 사용합니다.
  • 계단 함수는 입력값이 임계값(threshold) 이상이면 1을 출력하고, 그렇지 않으면 0(또는 -1)을 출력합니다.
  • 입력값과 가중치를 곱한 결과를 모두 더한 것이 임계값보다 크면 출력값은 1이 되고, 그렇지 않으면 출력값은 0(또는 -1)이 됩니다.

 

 

 

 

3. 퍼셉트론의 역사

  • 퍼셉트론은 1957년 코넬 학생인 프랑크 로젠블라트(Frank Rosenblatt)에 의해 처음으로 고안되었습니다.
  • 로젠블라트는 퍼셉트론이라는 용어를 처음으로 사용하였으며, 이를 바탕으로 퍼셉트론 학습 알고리즘을 고안하였습니다.
  • 초기에는 퍼셉트론이 XOR 문제와 같은 비선형 문제를 해결하지 못해 비판을 받았지만, 1980년대에는 다층 퍼셉트론이 등장하여 비선형 문제를 해결할 수 있게 되었습니다.
  • 퍼셉트론은 뉴런(뇌세포)의 개념을 처음 도입한 인공신경망의 핵심 개념 중 하나입니다.
  • 퍼셉트론의 학습 알고리즘인 경사 하강법(Gradient Descent)과 역전파(Backpropagation) 알고리즘은 지금까지도 인공신경망(딥러닝)의 학습 알고리즘으로 널리 사용되고 있습니다.

 

 

 

 

4. 다층퍼셉트론

다층퍼셉트론(MLP)

  • 다층퍼셉트론(Multi-Layer Perceptron, MLP)은 여러 개의 은닉층(hidden layer)을 가진 퍼셉트론입니다. 다층퍼셉트론은 입력층(input layer), 은닉층, 출력층(output layer)으로 구성됩니다.
    • 입력층(input layer)
      • 입력값이 들어오는 층입니다.
      • 입력층의 뉴런 개수는 입력값의 개수와 일치합니다.
    • 은닉층(hidden layer)
      • 입력층과 출력층 사이에 존재하는 층으로, 입력층과 출력층을 연결하는 중간 역할을 합니다.
      • 은닉층은 여러 개의 뉴런(neuron)으로 구성되며, 각 뉴런은 입력값과 가중치를 곱한 결과를 활성화 함수를 거쳐 출력값을 계산합니다.
      • 은닉층의 뉴런 개수와 은닉층의 개수는 사용자가 설정해야 하는 하이퍼파라미터입니다.
    • 출력층(output layer)
      • 출력값을 내보내는 층입니다.
      • 출력층의 뉴런 개수는 문제에 따라 다르게 설정됩니다. 이진 분류(Binary Classification) 문제에서는 출력층의 뉴런 개수를 1로 설정하고, 다중 분류(Multi-Class Classification) 문제에서는 출력층의 뉴런 개수를 클래스의 개수와 일치시킵니다.
    • 활성화 함수(Activation Function)
      • 은닉층과 출력층의 뉴런에서 계산된 값을 변환하여 출력값을 만드는 함수입니다.
      • 은닉층에서는 주로 시그모이드(Sigmoid), 하이퍼볼릭탄젠트(Hyperbolic Tangent), ReLU(Rectified Linear Unit) 등의 함수가 사용됩니다.
      • 출력층에서는 주로 소프트맥스(Softmax) 함수가 사용됩니다.
    • 역전파(Backpropagation) 알고리즘
      • 다층퍼셉트론은 오차 역전파 알고리즘을 사용하여 학습됩니다.
      • 역전파 알고리즘은 출력층에서부터 역순으로 오차를 전파하면서 각 층의 가중치를 업데이트합니다.
      • 역전파 알고리즘을 통해 가중치가 업데이트되면서, 다층퍼셉트론은 입력값에 대한 출력값을 더욱 정확하게 예측할 수 있게 됩니다.

 

 

 

5. 다층퍼셉트론(MLP)와 딥러닝의 관계

  • 다층퍼셉트론(MLP)은 위에서 설명하였듯 인공신경망의 한 종류이며, 딥러닝은 깊은 인공신경망을 구성하여 학습하는 기술입니다.  
  • 딥러닝에서는 MLP보다 훨씬 더 깊은 층(많은 수의 은닉층)을 가진 신경망을 사용하여 더 복잡한 문제를 해결합니다. 이를 위해서는 학습 데이터셋이 매우 크고 많은 계산 자원이 필요합니다.
  • 따라서, 다층퍼셉트론은 딥러닝의 기본적인 구성요소 중 하나이며, 다층퍼셉트론의 학습방식인 오차역전파가 딥러닝에서도 사용됩니다.

딥러닝

반응형

댓글