문제
https://school.programmers.co.kr/learn/courses/30/lessons/42747
문제설명
H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.
어떤 과학자가 발표한 논문 n
편 중, h
번 이상 인용된 논문이 h
편 이상이고 나머지 논문이 h
번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.
어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.
제한사항
- 과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
- 논문별 인용 횟수는 0회 이상 10,000회 이하입니다.
입출력 예
citations | return |
[3, 0, 6, 1, 5] | 3 |
입출력 예 설명
이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.
풀이
접근
H-Index : 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었을 때 h의 최댓값
리스트의 어떤 요소 n
이상인 수의 갯수가 n
이상이어야 한다
👉 내림차순 정렬했을 때, n
의 순서가 n
번째 이상이면 된다.
예를들어 [3,0,6,1,5]
일 때, 내림차순 정렬하면 [6,5,3,1,0]
h | h번 이상 인용된 논문 | 나머지 | H-Index |
6 | 6 -> 1개 | 4개 | X |
5 | 6, 5 -> 2개 | 3개 | X |
3 | 6, 5, 3 -> 3개 | 2개 | O |
1 | 6, 5, 3, 1 -> 4개 | 1개 | O |
0 | 6, 5, 3, 1, 0 -> 5개 | 0개 | X |
H-Index 가 가능한 h
는 3, 1
이고 최댓값이어야 하므로 H-Index = 3
이다.
즉, 내림차순 정렬한 리스트의 요소를 하나씩 돌면서 해당 요소가 해당 요소의 인덱스 + 1(인덱스는 0부터이므로) 보다 작을 때 처음 나온 요소가 H-Index이다.
👉 citations[i] < i+1 일 때 i = answer
반례
테스트케이스에서 시간초과가 뜨는 케이스가 생겼다. 생각해보니 H-index가 리스트 속 요소가 아닌 경우가 있을 수 있다.
h
번 이상 인용된 논문이 h
편 이상이어야 하므로 H-index는 무조건 리스트의 길이보다 작거나 같아야 한다.
예를 들어서 [10, 10, 10]
이나 [10, 11]
같이 모든 요소(모든 논문의 인용 횟수)가 리스트의 길이보다 큰 예라면,
H- index는 3([10, 10, 10]
), 2([10, 11]
)가 되어야 한다. 👉리스트의 길이가 H-index
풀이 코드
def solution(citations):
answer = 0
sorted_citation = sorted(citations,reverse = True)
for i in range(len(citations)):
if sorted_citation[i] < i+1:
answer = i
return answer
answer = len(citations)
return answer
GitHub 댓글