AI/Preprocessing

text preprecessing_numpy.argmax()

oaho 2023. 4. 3. 21:14
반응형

numpy.argmax() 함수는 배열에서 가장 큰 값의 인덱스를 반환하는 함수이다.

 

import numpy as np

arr = np.array([3, 7, 1, 9, 2])

이 배열의 경우, 가장 큰 값은 9이며 이 값의 인덱스는 3이다.
이때 np.argmax() 함수를 사용하면 다음과 같이 가장 큰 값의 인덱스를 반환할 수 있다.
 

index_of_max_value = np.argmax(arr)

print(index_of_max_value)
# Output: 3

출력값은 3 이다.
 
 
 
다차원 배열에서도 사용할 수 있다.
<2차원 배열>

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]

이 배열의 경우, 가장 큰 값은 9이며 이 값의 인덱스는 (2, 2)이다.
이때 np.argmax() 함수를 사용하면 다음과 같이 가장 큰 값의 인덱스를 반환할 수 있다.
 

index_of_max_value = np.argmax(arr)
print(index_of_max_value)
#Output: 8

배열을 평탄화하여 1차원 배열로 만든 후, 가장 큰 값의 인덱스를 반환해준다.
출력값은 8이다.
 

numpy.argmin() 함수는 배열에서 가장 작은 값의 인덱스를 반환하는 함수이다.

 

 

⭐ 응용

데이터중에 가장 큰 값의 인덱스를 구할 때 사용할 수 있다.
 
train_df 데이터프레임에서 각 행의 텍스트의 길이가 가장 긴 데이터, 가장 짧은 데이터, 해당하는 인덱스를 구해보겠다.


train_df 데이터프레임의 각 행의 text길이를 구했다.
 
 
argmax()와 armin()을 사용하지 않았을 때

최대길이, 해당하는 text내용, 해당하는 index
최소길이, 해당하는 text내용, 해당하는 index
 
 

argmax()와 armin()을 사용하여 최대길이, 최소길이의 해당하는 text내용과 인덱스를 구해보겠다.

단 두줄로 값을 구할 수 있었다!

반응형