출력층과 활성화 함수 종류

2024. 9. 30. 16:04AI

반응형

1. Dense(3, activation='softmax')

  • 용도: 다중 클래스 분류 (예: 이미지 분류에서 고양이, 강아지, 새 중 하나를 선택)
  • 출력: 3개의 출력 노드가 있으며, 각 노드는 하나의 클래스에 대한 확률을 나타낸다. 출력값의 합은 항상 1이 된다.
  • 활성화 함수: softmax는 각 클래스의 확률을 계산하고, 모든 확률의 합이 1이 되도록 조정한다. , [0.7, 0.2, 0.1]의 출력을 얻었다면, 이는 첫 번째 클래스가 70% 확률로 예측되었음을 의미한다.
  • 사용 예: 분류 문제에서 하나의 클래스만 정답인 상황에서 사용된다.

2. Dense(1)

  • 용도: 회귀 문제 (예: 주식 가격 예측, 집값 예측 등 연속적인 값 예측)
  • 출력: 1개의 출력 노드가 있으며, 하나의 연속적인 값을 출력한다.
  • 활성화 함수: 활성화 함수가 명시되지 않으면 기본적으로 선형(Linear) 활성화가 사용된다. 이는 출력에 특별한 제약을 두지 않으며, 모델이 자유롭게 값을 예측할 수 있음을 의미한다.
  • 사용 예: 연속적인 값(숫자)을 예측할 때 사용된다. , 주식 종가나 특정 제품의 가격을 예측하는 문제에서 유용하다.

3. Dense(1, activation='sigmoid')

  • 용도: 이진 분류 문제 (예: 이메일이 스팸인지 아닌지 예측)
  • 출력: 1개의 출력 노드가 있으며, 0과 1 사이의 값을 출력한다. 이 값은 해당 클래스에 속할 확률을 나타낸다.
  • 활성화 함수: sigmoid는 입력을 0과 1 사이의 확률로 변환한다. , 0.8의 출력은 해당 클래스일 확률이 80%임을 의미한다.
  • 사용 예: 이진 분류 문제에서 사용된다. ,병이 있는지 없는지, 예측 대상이 참인지 거짓인지 예측할 때 유용하다.

결론 

  • softmax: 다중 클래스 분류에서 사용하며, 각 클래스의 확률을 출력하고 그 합이 1이 됨.
  • Dense(1): 회귀 문제에서 사용하며, 연속적인 값을 예측.
  • sigmoid: 이진 분류에서 사용하며, 클래스에 속할 확률을 0과 1 사이로 출력.

 

반응형