Coding Test Practice/백준

[백준] 문자열 집합(boj_14425), silver3, python

still..epochs 2023. 3. 2. 14:26

https://www.acmicpc.net/problem/14425

 

14425번: 문자열 집합

첫째 줄에 문자열의 개수 N과 M (1 ≤ N ≤ 10,000, 1 ≤ M ≤ 10,000)이 주어진다.  다음 N개의 줄에는 집합 S에 포함되어 있는 문자열들이 주어진다. 다음 M개의 줄에는 검사해야 하는 문자열들이 주어

www.acmicpc.net

문제

총 N개의 문자열로 이루어진 집합 S가 주어진다.

입력으로 주어지는 M개의 문자열 중에서 집합 S에 포함되어 있는 것이 총 몇 개인지 구하는 프로그램을 작성하시오.

입력

첫째 줄에 문자열의 개수 N과 M (1 ≤ N ≤ 10,000, 1 ≤ M ≤ 10,000)이 주어진다. 

다음 N개의 줄에는 집합 S에 포함되어 있는 문자열들이 주어진다.

다음 M개의 줄에는 검사해야 하는 문자열들이 주어진다.

입력으로 주어지는 문자열은 알파벳 소문자로만 이루어져 있으며, 길이는 500을 넘지 않는다. 집합 S에 같은 문자열이 여러 번 주어지는 경우는 없다.

출력

첫째 줄에 M개의 문자열 중에 총 몇 개가 집합 S에 포함되어 있는지 출력한다.

 

 

문제풀이

처음 n개로 주어지는 집합 S를 만들고, m개 만큼 문자열을 받아서 집합 S에 해당 문자열이 존재할 때마다 카운트를 해주는 방식으로 풀이했다. 풀이 자체는 어렵지 않았으나, 내가 푼 풀이는 풀이 시간이 굉장히 오래 걸렸다.

# 문자열 집합
import sys
input = sys.stdin.readline

n, m = map(int, input().split())
n_li = [input() for _ in range(n)]
m_li = [input() for _ in range(m)]

cnt = 0
for i in m_li:
    if i in n_li:
        cnt += 1

print(cnt)

이유인 즉슨, 내가 사용했던 list 자료형은 삽입, 제거, 탐색, 포함 여부 확인 이 모두 O(n)에 해당하는 시간복잡도를 가지고 있기 때문이었다..!

 

다른 분들 풀이를 보니 원리는 같지만 set이나 dictionary 자료형으로 풀이한 경우 훨씬 더 적은 시간초가 걸렸는데, 집합과 딕셔너리는 삽입, 제거, 탐색, 포함 여부 확인 이 O(1)의 시간 복잡도를 가지고 있기 때문이었다.

 

앞으로 문제를 풀이할 때, 탐색이나 포함 여부를 확인하게 되는 경우라면 집합이나 딕셔너리를 사용하는 것이 좋을 것 같다.

 

# 문자열 집합
import sys
input = sys.stdin.readline

n, m = map(int, input().split())
n_se = set()

for _ in range(n):
    n_se.add(input())

m_li = [input() for _ in range(m)]

cnt = 0
for i in m_li:
    if i in n_se:
        cnt += 1

print(cnt)

 

자료 구조만 집합을 바꾸어줬는데도 훨씬 시간초가 적게 걸렸다~!