Ch.07-1 확인문제 1. 어떤 인공 신경망의 입력 특성이 100개이고 밀집층에 있는 뉴런 개수가 10개일 때 필요한 모델 파라미터의 개수는?A: 1010개,파라미터의 개수를 구하는 방법은 입력 특성에 출력층의 뉴런 개수를 곱한 가중치에 각 뉴런이 가지는 절편 개수를 더한다.(입력특성) * (뉴런 개수) + (뉴런 개수)100 * 10 + 10 = 1010 2. 케라스의 Dense 클래스를 이용해 신경망의 출력층을 만드려고 합니다. 이 신경망이 이진 분류 모델이라면 activation 매개변수에 어떤 활성화 함수를 지정해야 하나요?A: Signoid 함수Dense층은 밀집층, 완전 연결층이라고도 하며 뉴런과 입력층의 변수들이 모두 한 번씩 곱해져 가중치가 모두 생긴다. 밀집층에서는 분류하려는 클래스..
[필수과제]교차검증은 검증세트를 떼어 내어 평가하는 과정을 여러 번 반복하는 과정을 의미한다.교차 검증을 통해 얻은 점수들의 평균으로 최종 검증 점수를 얻을 수 있다.일반적을 5-폴드 교차 검증이나 10-폴드 교차검증을 많이 사용하며, 이를 통해 데이터의 80~90%까지 훈련에 사용할 수 있다. [선택과제]랜덤 포레스트(Random Forest)랜덤 포레스트는 가장 대표적인 앙상블 학습 알고리즘으로, 결정 트리를 훈련하기 위해 부스트랩 샘플을 만들고 전체 특성 중 일부를 랜덤하게 선택하여 결정트리를 만든다. 엑스트라 트리(Extra Tree)엑스트라 트리는 랜덤 포레스트와 매우 비슷하지만 부트스트랩 샘플을 사용하지 않고 노드를 분할할 때 최선이 아니라 랜덤하게 분할한다. 따라서 랜덤 포레스트보다 훈련 ..
[필수 과제]로지스틱 회귀로지스틱 회귀는 분류 모델의 한 종류로 선형 회귀와 동일하게 선형 방정식을 학습한다. 예를 들어 아래와 같이 나타낼 수 있다.여기서 a, b, c, d e는 가중치, 혹은 계수를 의미하고, z는 어떤 값도 가능하다.하지만 이를 확률로 나타내려면 0과 1사이의 값으로 나타내야한다. 이때 사용되는 함수가 바로 시그모이드 함수(Sigmoid function)이다. 시그모이드 함수는 z가 아주 큰 음수일때 0이 되고, 아주 큰 양수일때 1이 될 수 있게 아주 복잡한 계산을 통해 위와 같은 그래프를 만들 수 있다. [선택 과제]에포크 횟수가 적으면 모델이 훈련 세트를 덜 학습하지만, 횟수가 늘어날 수록 훈련 세트를 학습을 더 하여 훈련 세트에 아주 잘 맞는 모델이 만들어진다. 이를 바꿔말..
[필수 과제] 위와 같은 코드를 실행했을 때, n이 커짐에 따라 그래프의 모양이 나타난다. k-최근접 이웃 알고리즘에서 이웃의 개수를 줄이면 훈련세트에 있는 국지적인 패터에 미감해지고, 이웃의 개수를 늘리면 데이터 전반에 있는 일반적인 패턴을 따르기 때문에 n이 1이었을 때, 데이터 값에 좀더 fit한 그래프 모양이 그려지며, 5개, 10개로 늘어날 수록 그래프의 모양이 좀 더 단순하게 나타남을 알 수 있다. [선택과제]Model ParameterModel Parameter은 모델 내부에 존재하는 구성 변수로, 데이터로부터 값을 추정할 수 있습니다.모델이 예측을 할 때 필요하다.문제에 대한 모델의 기술을 정의하는 값.실무자가 수동으로 설정하지 않는 경우가 많으며 학습된 모델의 일부로 저장되는 경우가 많..