- WIPO 기술분류 전기 > 컴퓨터기술
- 표준산업분류 컴퓨터 프로그래밍, 정보서비스업
- 국가과학기술표준분류 건설/교통 > 국토공간개발기술
- 지식재산권 상태 등록
- 출원일/등록일 2015-05-21 / 2016-10-05
- 거래유형 양도/실시권설정 모두가능
- 기술료 조건 협의 후 결정
국지적 공간 의존성 지표를 이용하여 특정 키워드에 대한 트위터 상의 유력지역 탐색방법
- 서울대학교산학협력단
- 요약
- 본 발명은 국지적 공간 의존성 지표를 이용하여 특정 키워드에 대한 트위터 상의 유력지역 탐색방법에 관한 것으로, (a) 트윗 추출 모듈이 수집을 원하는 지역을 대상으로 하여 일정 기간 동안의 지오태깅된 트윗을 수집 추출하여 트윗 데이터 DB에 저장하는 단계와; (b) 키워드 추출 모듈이 포털사에서 순위로 제공하는 랭킹뉴스를 대상으로 트윗 데이터 수집 기간 동안 화제가 된 핫이슈 키워드들을 범주별로 일정 개수 이상씩 추출하여 키워드 데이터 DB에 저장하는 단계와; (c) 매칭 모듈이 키워드 데이터 DB에 저장된 키워드들을 트윗 데이터 DB에 저장된 지오태깅된 트윗 데이터에 매칭시켜, 핫이슈 키워드를 포함하는 트윗의 개수가 일정 개수 이상인 트윗과 키워드만을 추출하는 단계와; (d) 노출도 산정 모듈이 상기 단계(c)에서 추출된 각각의 트윗을 대상으로 노출도를 계산하고, 상기 단계(c)에서 추출된 핫이슈 키워드 각각에 대한 행정동별 노출도를 산출하는 단계, 및 (e) 유력지수 산정 모듈이 상기 단계(d)에서 산출된 행정동별 노출도를 바탕으로 국지적 공간 의존성 지표인 를 이용하여 핫이슈 키워드 각각에 대한 행정동별 유력지수를 산출하는 단계로 이루어짐으로써, 특정 키워드에 대한 유력자들의 위치 정보를 파악하고, 해당 지역에서 관련 마케팅을 실시할 수 있다는 점에서 해당 키워드에 대한 유력지역 정보가 유용하게 사용될 수 있는 효과가 있다.
- 대표청구항
- (a) 트위터에서 제공하는 오픈 API(Open Application Programming Interface)를 이용하여 트윗 추출 모듈(10)이 수집을 원하는 지역을 대상으로 하여 일정 기간 동안의 지오태깅된 트윗을 수집 추출하여 트윗 데이터 DB(11)에 저장하는 단계와; (b) 포털사에서 제공하는 오픈 API(Open Application Programming Interface)를 이용하여 키워드 추출 모듈(20)이 포털사에서 순위로 제공하는 랭킹뉴스를 대상으로 트윗 데이터 수집 기간 동안 화제가 된 핫이슈 키워드들을 범주별로 일정 개수 이상씩 추출하여 키워드 데이터 DB(21)에 저장하는 단계와; (c) 매칭 모듈(30)이 상기 단계(b)에서 범주별로 추출되어 키워드 데이터 DB(21)에 저장된 키워드들을 상기 단계(a)에서 수집하여 트윗 데이터 DB(11)에 저장된 지오태깅된 트윗 데이터에 매칭시켜, 핫이슈 키워드를 포함하는 트윗의 개수가 일정 개수 이상인 트윗과 키워드만을 추출하는 단계와; (d) 노출도 산정 모듈(40)이 상기 단계(c)에서 추출된 각각의 트윗을 대상으로 노출도(Exposure Index, EI)를 계산하고, 노출도가 부여된 트윗에 대해 해당 지역의 행정동과 공간 결합(spatial join) 연산을 수행함으로써 상기 단계(c)에서 추출된 핫이슈 키워드 각각에 대한 행정동별 노출도를 산출하는 단계, 및 (e) 유력지수 산정 모듈(50)이 상기 단계(d)에서 산출된 행정동별 노출도를 바탕으로 국지적 공간 의존성 지표인 를 이용하여 핫이슈 키워드 각각에 대한 행정동별 유력지수(Influenial Index, II)를 산출하는 단계로 이루어지되, 상기 국지적 공간 의존성 지표인 은 다음의 수학식, (여기서, i와 j는 각 공간단위(예를 들어, 서울시 행정동 423개)를 의미하고, 는 공간단위i의 국지적 공간 의존성 지표값이며, wij는 공간 가중 행렬의 요소 값으로 i와 j가 인접하면 1, 그렇지 않으면 0의 값을 갖고 행표준화 (row-standardized)가 행해진 값이며, 자신 또한 이웃으로 간주하기 때문에 wii=1이고, n은 i와 j로 이루어진 모든 공간 단위의 개수(예를 들어, 서울시 행정동 423개), xj는 j번째 변수(즉, 각각의 행정동에 대한 노출도의 단순 합), 는 xj의 평균( ), s는 xj의표준편차( )임)으로 산출하는 것을 특징으로 하는, 국지적 공간 의존성 지표를 이용하여 특정 키워드에 대한 트위터 상의 유력지역 탐색방법.
문의 및 상담신청
팝업닫기