2021 빅콘테스트 이노베이션 분야 우수상 후기
in Project on Competition
2021 빅콘테스트 이노베이션 분야에 3명의 팀원들과 함께 참가하여 우수상을 수상하였습니다. 빅콘테스트는 기업에서 실제 보유하고 있는 데이터를 자유롭게 활용하여 새로운 비즈니스 모델 및 참신한 아이디어를 제시하고, 데이터 인재발굴을 통한 청년 취업 기회를 제공하고자 하는 취지로 개최되는 대회입니다. 국내 데이터 분석 경진대회 중 최대 규모를 자랑하는 것으로 알려져 있습니다.
대회의 주제는 ‘디지털 경제 기반 군산시 지역경제 활성화를 위한 비즈니스 아이디어 및 PoC 결과 제시’ 였습니다. 대회는 8월 3일 데이터 공개를 시작으로 9월 15일까지 진행되었습니다.
대회 준비 기간은 길었지만 준비 과정은 녹록지 않았습니다. 팀원들은 인턴 활동 중이었고, 저는 부스트캠프 AI Tech 강의 수강과 데이터청년캠퍼스 최종 프로젝트를 병행하던 차라 주말에만 모일 수 있었습니다. 그랬기에 중간중간 불안한 순간도 많았지만, 모두들 시간을 틈틈히 쪼개가며 끝까지 힘냈기 때문에 다행히 잘 마무리할 수 있었습니다.
이 대회에서 저의 역할은 데이터를 활용하여 함께 고민한 비즈니스 문제를 효과적으로 풀 방법을 고민하고 구현하는 것이었습니다. 머신러닝 공부는 꾸준히 해왔지만 실제 데이터에 적용하고 활용해본 경험은 거의 없었기 때문에 데이터 기반으로 문제 해결 방안을 제시하기 쉽지 않았습니다. 그럼에도 불구하고 저를 믿고 분석을 맡겨준 팀원들에게 고마웠습니다.
Ideation
당시 군산시는 현대중공업 조선소 가동 중단과 한국GM 군산공장 폐쇄로 지역 경제에 위기가 닥치자 2018년 고용위기지역으로 지정됐고 이후 2020년에 이어 2021년 12월까지 2차례 연장되었습니다.
본래 조선소와 자동차 제조 등 전통적인 산업이 중심이었던 군산 경제는 2018년을 기점으로 큰 위기를 맞았고, 이를 돌파할 수단 중 하나로 관광 산업을 발전시키기 시작합니다.
군산의 관광 자산인 근대 유산들을 활용한 축제를 기획하고 적극적으로 홍보하며 ‘스마트 관광도시 차별화’ 를 목표로 했지만, 엎친데 덮친 격으로 펜데믹이 발생하여 관광 도시로써 변모하고자 하는 노력도 찬물을 맞게 됩니다.
한국관광 데이터랩을 통해 군산시 내국인 지출액(BC+신한)을 보면 펜데믹 발생 후 방역 대책이 시행되기 전과 비교했을 때 군산시 내국인 관광 총 소비액이 급감했다는 것을 알 수 있습니다. 2018년과 2019년 약 1400억 원을 초과하던 관광 총 소비액이 2020년 약 1000억 원으로 400억 원 이상 감소하였습니다. 2019년과 비교하여 2020년 관광 총 소비액은 감소율은 30.4% 입니다.
한국관광 데이터랩의 지역별 방문자 수를 보면 팬데믹으로 인해 방문자 수도 급감했다는 것을 알 수 있습니다. 2019년 2400만 명에 달하던 외부 관광객 수가 2020년 2150만명으로 줄었습니다. 2019년 대비 2020년 외부 방문자수 감소율은 10.21% 입니다.
또한, 관광 도시로써 군산의 문제점 중 하나는 주요 관광객들이 인접 도시에 한정된다는 점입니다. 특히 이러한 문제점은 펜데믹이 한창이던 2020년 도드라집니다. 방문자 중 군산과 70Km 이내 거주하는 이의 비중은 전체 방문자 중 45.49% 인 반면, 190Km 이상 떨어진 지역에서 방문한 이들은 전체 방문자 중 13.82% 에 불과합니다.
군산과 비슷하게 2018년 고용위기지역으로 지정되고, 관광 인프라가 탄탄한 통영은 종종 군산과 비교됩니다. 통영의 경우 방문자 중 190Km 이상 떨어진 지역에서 방문한 이들은 전체 방문자 중 24.84%를 차지하고 있습니다.
뿐만 아니라, 관광 도시라는 특성 상 주말과 평일의 방문자 수 차이가 크다는 문제도 있습니다. 2021년 1월 1일과 2021년 1월 31일 사이 군산시 일간 외부 방문자 수 추이 그래프를 보면, 휴일엔 유입 인구가 많지만 평일엔 그렇지 않다는 것을 확인할 수 있습니다. 관광 도시라면 대부분 가지고 있는 특성이지만 주말과 평일의 유입인구 차이, 비수기와 성수기의 유입인구 차이는 관광 산업의 비효율을 초래합니다.
이러한 자료를 보며, 관광 산업 활성화를 위해, 평일 ・ 비수기에도 관광객을 끌어들일 수단과 멀리 떨어진 지역에 위치한 거주자들을 군산으로 유입시킬 방안이 필요하다고 판단하였습니다.
워케이션(Workation)
펜데믹으로 기존과 다른 일상을 맞이한 후, 눈에 띄는 차이 중 하나는 재택 근무의 활성화였습니다. 코로나 바이러스의 전염을 차단하기 위해 언텍트 사회가 일상화되었고 업무의 영역까지 파고 들었습니다. 재택 근무가 일상화된 세상에서 사람들은 집에서만 일을 할 필요가 없다는 것을 알게 되었습니다.
또한, 사람이 많이 몰리는 인기 관광지를 기피하고 숨은 지역에서 체류형 관광을 선호하는 트렌드가 등장하였습니다. 한국관광공사의 ‘2021 국내여행 트렌드‘를 보면 인기 관광지보다는 한적한 소도시나 지역 위주의 여행이, 단체보다는 소수 친밀한 사람들과의 여행이 주목받고 있다는 것을 알 수 있습니다. 펜데믹으로 인해 사람들이 많이 찾는 곳으로 여행을 떠나기 보다 마음껏 숨 쉴 수 있는 곳에서 여유로운 일상과 자연 경관을 즐기고자 하는 체류형 관광의 수요가 늘어났습니다.
이렇게 근무와 여행 트렌드가 변화하며 워케이션이 주목받기 시작합니다.
한국관광공사에 따르면 워케이션(workation)이란 ‘일(work)’과 ‘휴가(vacation)’의 합성어로, 근로자가 휴가지에서 일상적인 업무를 수행하면서 관광과 휴양을 동시에 실시하는 것을 의미합니다.
서양과 일본에서는 이전부터 관심을 받은 주제였지만, 한국에선 2021년부터 본격적으로 사람들의 관심을 받기 시작하였습니다.
“김대리, 휴가 간김에 거기서 일해”… 워케이션하는 IT기업들
오션뷰 보며 ‘재텔근무’ 해봤니? 20만원에 누려본 제주살이
산적한 시골에서 자연 경관을 즐기며 업무와 휴식을 병행하고자 하는 워케이션은 사람들의 눈길을 끌었습니다. 에어비엔비가 여론조사기관(YouGov)에 의뢰해 진행한 설문조사 결과에 따르면 한국인 응답자의 61%는 가능하기만 하다면 집이 아닌 다른 곳에서 일하면서 휴가와 같은 분위기를 즐기는 ‘워케이션(work-ation)’을 시도해 볼 의향이 있다고 밝혔습니다.
회사가 아닌 다른 곳에서 일하는 데 있어 가장 매력적인 요소가 무엇인지 묻는 질문에 대해서는 51%가 일상과 다른 풍경 속에서 새로운 경험을 할 수 있다는 점을 꼽았고, 한국인 응답자의 74%는 국내의 해안가나 지방을 원격근무 하거나 살아볼 만 한 장소로 생각하는 것으로 나타났습니다.
한국관광공사의 워케이션 활용 국내관광 활성화 방안 연구용역 결과보고서, 47 - 58 페이지를 보면 이러한 응답을 뒷받침하는 인터뷰 결과를 확인할 수 있습니다.
Q: 워케이션을 경험해본 적이 있으신가요?
“이전에 부여에 놀러갔을 때 연꽃 정원 내 카페에서 근무를 했던 적이 있습니다. 색다른 곳에서 아름다운 경치를 즐기며 일을 할 수 있어서 만족도가 매우 높았습니다.” - 조OO
“강릉을 놀러갔을 때 카페는 체류시간이 제한적이었기 때문에, 숙소에서 일을 했던 적이 있습니다. 숙소 내에 자체적으로 업무 공간을 조성, 바다를 보면서 일할 수 있었습니다.” - 여OO
Q: 워케이션을 갈 의향이 있으신가요?
“삶과 일의 균형에 있어서 따로 구분 짓는 것이 아닌 스스로 자유롭게 휴가를 조율하고 선택할 수 있다는게 가장 큰 메리트인 것 같습니다. 개인적으로는 지속적으로 워케이션을 해보고 싶습니다.” - 여OO
“워케이션은 일반 휴가에 비해 메리트가 부족한 것 같습니다. 그러나 회사에서 사내복지의 한 형태로 지원을 해주고 근무시간을 자유롭게 조정할 수 있다면, 갈 의향이 있습니다.” - 조OO
“일과 휴가가 분리된다는 전제라면 시도해보고 싶습니다. 안전한 집이 좋긴 하지만, 그 집이 꼭 내 집일 필요는 없다고 생각합니다. 일주일 정도라도 휴가지에 가서 근무 후에 휴가를 보내면 좋을 것 같습니다.” - 김OO
이처럼 많은 사람들이 일상과 다른 자연 경관을 즐기며 새로운 경험을 할 수 있다는 점에서 워케이션에 관심을 보이고 있다는 것을 알 수 있습니다.
발 빠르게 워케이션 관광 상품을 기획하고 출시하여 성공한 국내 사례도 찾을 수 있었습니다.
강원도와 인터파크투어가 연계하여 강원도의 각 지역의 호텔과 리조트를 활용하고, 객실 특가와 바다 전망, 객실 업그레이드, 이른 체크인과 늦은 체크아웃, 커피와 음료 이용권 제공 등의 맞춤형 혜택을 주는 워케이션 관광 상품을 출시했습니다.
이 상품은 큰 인기를 끌었습니다. 출시 후 2개월 만에 8,238박의 숙박 유치에 성공합니다. 특히 워케이션 상품은 주중 관광객 유치와 체류시간 연장에 기여했는데, 주중 숙박이 지난해 같은 기간보다 25% 이상 증가했고 주중 3박 이상 예약은 1326박으로 13% 늘었다고 합니다.
워케이션과 군산
워케이션은 일회성 관광에 그치지 않고, 주중에도 사람들이 지역에 머물게 효과를 가지는 체류형 관광입니다. 관광객의 체류 기간이 늘면서 지역 경제 활성화에도 효과적입니다. 또한, 워케이션을 선호하는 트렌드는 특정 지역에서만 보이는 현상이 아니므로 가까운 지역에 한정된 군산시의 관광객 커버리지도 넓히는 효과를 기대할 수 있습니다.
군산은 바다와 인접한 도시로 자연 경관이 빼어난 것으로 유명한 고군산군도를 보유하고 있습니다. 특히 고군산군도 가운데 즈음 위치한 선유도는 ‘신선이 노니는 섬’으로 불리며 아름다운 해질녘 풍경을 자랑합니다.
1930년대 근대문화유산을 고스란히 간직하고 있는 것도 큰 장점입니다. 시간여행마을과 같이 도시 곳곳에 남아있는 일본식 주택과 근대건축물들을 쉽게 볼 수 있습니다. 2.5km 길이의 오래된 철도가 놓인 경암동 철길마을은 출사지로도 유명하며, 8월의 크리스마스로 유명한 초원사진관도 있습니다. 비응항 어시장, 우리나라에서 가장 오래된 빵집, 전국 5대 짬뽕 맛집, 70년 역사의 호떡집 등 들려볼 만한 맛집도 다수 있습니다.
이러듯 군산은 자연 경관과 볼거리 등 워케이션에 적합한 관광 인프라를 보유하고 있습니다. 하지만 일을 하기 위해 필요한 업무 인프라는 부족합니다.
23.11.03일을 기준으로 네이버 지도 검색을 통해 본 군산시에 위치한 공유 오피스는 단 2개에 불과합니다. 공모전을 준비하던 21년도에는 그린 망고 하나였습니다. 워케이션을 위해 업무 환경은 중요합니다. 노트북 하나만 있어도 업무를 할 수 있는 사람이라도 와이파이는 필수이며, 업무를 위해 필요한 시설이 갖춰져야만 합니다. 앞서 보았던 워케이션 활용 국내관광 활성화 방안 연구용역 결과보고서에는 업무 인프라에 대한 사람들의 의견이 담겨 있습니다.
Q: 워케이션에서 필요한 워크 인프라는 무엇인가요?
“의자가 편하고 책상이 넓은 것이 중요합니다. 또한 콘센트가 많을수록 좋습니다. 또한 일터의 경관이 뛰어나면 좋습니다.” - 조OO
“숙소는 일하기에는 너무 좁고 재택근무와 다를 바가 없기 때문에 차라리 평상시에 누리지 못했던 업무공간이 숙소 가까이에 있으면 좋을 것 같습니다.” - 김OO
“클라이언트와 원격으로 연락이 잦기 때문에 원격회의를 할 수 있는 시설이 필요합니다.” - 여OO
Q: 워케이션에서 어떤 부분이 한계로 작용할 수 있을까요?
“집에서 재택근무를 할 때, 아무래도 업무 세팅이 완벽하지 못해 환경적인 측면에서 불편한 적이 많았습니다. 따라서 일을 할 수 있는 업무 인프라가 중요할 것 같습니다.” - 조OO
“집에서만 일을 하다 보면 답답하고 집중이 어려워 리프레시 차원에서 카페를 가기도 했는데, 만일 숙박시설에서만 업무를 진행한다면 힘들 것 같습니다.” - 최OO
이렇듯 잘 갖춰진 업무 인프라는 워케이션의 핵심 요소이며, 워케이션 활성화를 위해 군산시에는 사람들이 만족할 수 있는 업무 인프라 구축이 필요합니다.
지방의 골칫거리, 빈집
저출산과 고령화에 따른 인구감소, 대규모개발사업 중심의 도시 확장 등으로 인한 지역불균형으로 빈집 문제는 마을에서 지역사회, 광역권역, 더 나아가 국가적인 문제로 부각되고 있습니다. 한국농촌경제연구원의 ‘농촌 빈집 실태와 정책과제’의 3장, 전국 농촌 빈집 실태 분석 부분을 보면 빈집으로 추산되는 농촌 주택은 26만채에 달합니다. 이는 당시 전국 주택의 5%에 이르는 규모입니다.
또한, 1장 서론의 1.1 연구 배경을 보면 지방 사회의 빈집은 대부분 방치되거나 적절히 관리되지 못해 경관을 해칠 뿐만 아니라, 농촌 치안과 환경, 위생 등 생활 전반을 위협한다는 것을 알 수 있습니다.
당시 빈집 문제를 알리는 기사도 다수 확인할 수 있습니다.
농촌엔 빈집만 26만채 “병원·슈퍼 사라지고 을씨년스러운 폐가만”
이러한 와중에, 빈집을 활용하여 여행 상품을 기획한 사례를 발견할 수 있었습니다.
마음 포근한 시골에서의 몇일, 재생 빈집 여행 ‘시골하루’ 눈길
‘시골하루’는 최근 사회문제로 대두되고 있는 지방의 폐·공가 문제를 해결하기 위해 더몽에서 기획한 로컬 여행상품입니다. 더몽은 전남 담양에 방치되어 있던 노후 빈집을 새로운 휴식 및 체험의 공간으로 탈바꿈시켰습니다. 숙박시설을 갖춘 시골 독채에서 유아, 어린이를 대상으로 진행되는 자연 교육 프로그램을 운영하며 도시에 거주하는 가족 단위 여행객을 타겟으로 상품을 기획하였습니다.
이러한 사례처럼 군산시에서도 지자체에서 나서 빈집을 숙박과 업무가 가능하도록 개조해서 활용한다면, 업무 인프라 부족 문제를 해결할 수 있겠다고 생각했습니다. 그렇게 된다면 관광 인프라와 업무 인프라를 두루 갖춘 군산은 워케이션을 원하는 사람들의 니즈를 만족시킬 수 있는 매력적인 도시가 될 수 있을 것입니다. 마침 공공데이터포털에서 군산시 빈집데이터현황도 확보할 수 있었습니다.
이러한 자료 조사 과정을 거쳐, 군산시 지역 경제 활성화를 위한 빈집을 활용한 워케이션 활성화 방안 제안이 우리의 솔루션이 되었습니다.
PoC
빈집을 활용한 워케이션 활성화 방안을 군산에 맞게 적용하면 좋겠다는 결론을 내린 후, 어떻게 데이터를 이용한 솔루션을 제공할 수 있을지 고민해보았지만 쉽지 않았습니다.
데이터를 활용한 솔루션하면 떠오르는 것은 머신러닝인데 분류, 회귀 같은 지도학습으로 풀 수 있는 일반적인 머신러닝 문제들과는 성격이 달랐습니다. 데이콘, 케글같은 경진대회에선 머신러닝으로 쉽게 접근할 수 있는 문제를 주지만 아이디어를 고민하고 그것을 데이터로 풀고자 할때는 머신러닝으로 해결하기에 딱 맞는 상황으로 만들기 쉽지 않았습니다.
또한, ‘워케이션을 원하는 사람들에게 꼭 필요한 업무 인프라가 무엇인지’나 ‘워케이션을 선호하는 사람들에게 더욱 매력적으로 보이도록 빈집을 정비하거나 체험 프로그램을 기획’ 하는 것은 데이터를 활용하여 제안한 솔루션이라고 하기엔 단순하다고 느꼈습니다.
워케이션 입지 선정 인덱스
고민을 거듭하던 중, 워케이션을 떠나고자 하는 사람들이 선호하는 요소가 무엇인지 파악하고, 그러한 요소를 고려하여 워케이션 입지 선정을 도와주는 인덱스가 있다면 유용할 것이라고 판단하였습니다. 자연 경관이 빼어난 곳과 같이 워케이션을 원하는 사람이 선호하는 위치에 숙소가 자리잡는 것은 체류형 관광 특성 상 이용객에게 매우 중요한 요소이기 때문입니다.
워케이션 관련 텍스트를 분석하여 그 안에 드러난 사람들의 선호를 수치화하여 표현하고, 워케이션 입지 선정에 활용할 수 있다면 워케이션에 더욱 적합한 빈집을 골라 워케이션 선호 관광객을 끌어들이는데 도움이 될 것입니다.
뉴스기사나 블로그, SNS 등에서 워케이션 관련 텍스트를 추출하고자 하였지만, 시간 부족과 크롤링 미숙으로 뉴스기사만 활용할 수 있었습니다. 그마저도 기사 하나하나를 직접 수집하였습니다. 1,012개의 신문 기사를 수집한 후 중복되거나 관련없는 기사를 모두 제거해보니 565개의 기사가 남았습니다.
워케이션 관련 주요 키워드가 무엇인지 확인하기 위해 워드클라우드 결과를 확인해보았습니다. 수집한 뉴스 텍스트를 Kiwi 형태소 분석기를 통해 토큰화한 후 고유 명사와 일반 명사만 활용하였습니다. 동사와 형용사를 포함시켰을 때 빈도수가 높은 단어는 ‘즐기’, ‘지속’, ‘높이’ 등으로 해석에 큰 의미를 부여하기 어려웠고, 그 외 품사는 모두 포함시켰을 때 불용어를 제외하였음에도 ‘부터’, ‘다는’, ‘것’ 과 같이 노이즈처럼 남아 활용하지 않았습니다.
워드클라우드는 단어의 빈도수만을 기준으로 시각화하기 때문에 어떤 맥락에서 등장한 단어인지 판단하기는 어렵습니다. 그렇기 때문에 Word2Vec을 활용해 뉴스 텍스트에 등장한 단어(토큰)를 임베딩하고, 특정 키워드와 유사한 단어들을 확인하여 어떤 맥락에서 등장한 것인지 유추하였습니다.
Word2Vec은 ‘단어의 의미는 주변 단어에 의해 형성된다’는 분포 가설에 입각하여 단어 별 의미상 유사성을 측정할 수 있도록 도와주는 자연어 처리 기법입니다. 텍스트에 등장하는 단어를 벡터로 임베딩하는 과정에서 주변 단어의 분포가 유사한 단어들은 유사한 벡터가 되게끔 유도됩니다.
워드클라우드 결과를 확인해 보았을 때, 눈에 띄는 단어 하나는 ‘공간’ 입니다. 해당 키워드가 어떤 맥락에서 등장한 것인지 판단하기 위해 뉴스 텍스트를 학습한 Word2Vec으로 유사한 단어를 확인해보았습니다.
model.wv.most_similar("공간")
[('시설', 0.8135786056518555),
('생활', 0.8101311326026917),
('환경', 0.7759951949119568),
('개인', 0.770084798336029),
('효율', 0.7684916853904724),
('스터디', 0.7628516554832458),
('생산', 0.7596110701560974),
('복합', 0.7568050026893616),
('목적', 0.752890944480896),
('프로그램', 0.7515978813171387)]
생활, 환경과 같은 단어와 유사도가 높은 것은 자연, 경관과 같은 맥락에서의 공간을 의미하는 것 같습니다. 반면 시설, 효율, 생산과 같은 단어와 유사도가 높은 것을 보면 업무 인프라의 맥락에서도 등장하는 것으로 보입니다.
model.wv.most_similar("시설")
[('편의', 0.8757914304733276),
('공유', 0.8573412299156189),
('커뮤니티', 0.8567796945571899),
('체험', 0.8465346693992615),
('프로그램', 0.8446810841560364),
('레저', 0.8443772196769714),
('비즈니스', 0.8401544094085693),
('의식', 0.833768367767334),
('거점', 0.823045551776886),
('공간', 0.8135784864425659)]
‘시설’ 키워드와 유사한 단어를 확인해보았을 때 결과는 위와 같습니다. ‘체험’, ‘레저’, ‘프로그램’ 같은 단어를 보아 여행지에서 할 수 있는 독특한 체험 활동 관련 맥락에서도 등장하는 것 같고, ‘공유’, ‘비즈니스’ ‘거점’ 등 단어를 보아 업무 시설의 맥락에서 이해할 수도 있을 것 같습니다.
개인적인 판단으로는, ‘공간’ 키워드와 ‘시설’ 키워드에서 공통적으로 등장하는 맥락은 자연 경관과 체험과 같이 관광지에서 누릴 수 있는 독특한 경험과 일할 때 불편하지 않을 업무 인프라에 대한 니즈인 것 같습니다.
‘농촌’ 키워드도 눈에 띕니다. Word2Vec 기준 ‘농촌’과 유사도가 높은 단어는 다음과 같습니다.
model.wv.most_similar("농촌")
[('휴양', 0.9341228008270264),
('자원', 0.8976897597312927),
('체험', 0.895241916179657),
('농어촌', 0.8808298110961914),
('마을', 0.8788034319877625),
('발굴', 0.8631742000579834),
('조용히', 0.8616477847099304),
('기반', 0.8573242425918579),
('교육', 0.8502225279808044),
('활력', 0.8435260653495789)]
‘휴양’, ‘조용히’, ‘체험’, ‘활력’ 등이 워케이션 뉴스 안에서 농촌의 인식이 어떤지 보여주는 것 같습니다. 조용히 쉬며 활력을 얻을 수 있는 공간으로 사람들에게 인식되는 것 같습니다.
model.wv.most_similar("체험")
[('휴양', 0.8990614414215088),
('농촌', 0.8952420353889465),
('힐링', 0.8724514245986938),
('레저', 0.8655511140823364),
('맞춤', 0.8597797751426697),
('콘텐츠', 0.8577631115913391),
('연계', 0.8476634621620178),
('교육', 0.847281277179718),
('시설', 0.8465346693992615),
('형', 0.8424206972122192)]
model.wv.most_similar("힐링")
[('생활', 0.8765436410903931),
('체험', 0.8724515438079834),
('레저', 0.8622169494628906),
('트래킹', 0.861031174659729),
('여가', 0.8579907417297363),
('휴양', 0.8477442860603333),
('겸하', 0.8474553227424622),
('명상', 0.842999279499054),
('조용히', 0.8414562344551086),
('의식', 0.8324880599975586)]
‘농촌’ 과 더불어 ‘체험’, ‘힐링’ 키워드와 유사한 단어를 확인해본 결과, 워케이션을 통한 경험에서 사람들이 기대하는 가치는 한적한 시골에서 조용히 휴식을 취하고, 색다른 체험을 해보는 것이라는 느낌을 받았습니다.
앞서 Ideation 과정에서 조사한 것과 함께 생각해보면, 사람들이 워케이션을 통해 얻고자 하는 것은 일을 병행하면서도 멋진 경치를 즐길 수 있는 한적한 공간에서 색다른 경험을 하는 것이라고 판단됩니다.
워케이션 하기 좋은 곳은 조용하고 경치 좋은 환경을 갖추고 있으며, 단기간 체류하기 위해 필요한 기본 인프라가 있는 곳이어야 할 것입니다.
이러한 분석을 통해 자연을 즐길 수 있는 장소인지와, 일상 속에서 느낄 수 없는 체험을 할 수 있는 관광지가 얼마나 인접해있는지를 워케이션 입지에 가장 중요한 요소로 판단하였습니다.
이 외에 체류형 관광이라는 워케이션의 특성 상 꼭 필요한 요소들을 입지 선정 조건에 포함시켜 자연환경, 관광지, 문화시설, 생활편의, 맛집, 보건의료 라는 6가지 특성을 고려 요소로 선정하였습니다.
구체화
‘자연환경’ 특성은 빈집 주변에 바다, 저수지, 산 등 자연적인 지형지물이 얼마나 가까이 위치해있는지를 활용하였습니다. 바다와 저수지는 빈집 좌표와 해안선, 저수지 둘레 좌표 간 최단거리를 구한 후, 최단거리의 역수를 지표로 활용하였고, 산은 산의 중심지를 기준으로 빈집의 1km 이내에 포함되는 산의 개수를 활용하였습니다.
공공데이터포털에 존재하는 군산 인프라 데이터들을 활용하여 ‘관광지’, ‘문화시설’, ‘보건의료’, ‘생활편의’ 특성은 빈집 별 1km 이내 존재하는 관련 인프라 수의 합계를 활용하였습니다. 도보로 이용 가능한 소생활권을 ‘15분 정도 걸어서 닿을 수 있는 1km’로 규정하는 관례를 따라 1km를 기준을 정했습니다.
‘맛집’ 특성은 대회 주최 측에서 제공해 준 식신 데이터를 참고하여 ‘식당 수 * 해당 식당의 검색량’을 지표로 활용하였습니다.
위 테이블은 공공데이터포털과 QGIS를 활용하여 구축된, 위치 선정 인덱스를 구하기 위해 필요한 Raw 데이터 예시입니다. Raw 데이터의 특성을 조합하여 앞서 언급된 워케이션 입지 선정을 위한 6가지 특성을 추출하였습니다. 각 특성은 MinMaxScaler를 활용하여 0 ~ 1 사이로 스케일을 동일하게 조정해주었습니다.
이 후, 특성 별 해당 특성과 관련된 요소가 언급된 워케이션 기사 수를 기반으로 가중치를 부여하였습니다. 각 특성 별 언급 기사 수는 다음과 같습니다.
키워드를 포함하는 워케이션 기사 개수
한 글자 키워드 제외 (빈도수가 높게 나오기 때문)
# 자연 + 바다 + 저수지 + 공원
138 + 120 + 5 + 44 = 307
# 관광
281
# 음식
43
# 시장, 편의점, 마트
110 + 7 + 40 = 157
# 도서, 영화
45 + 22 = 67
# 병원, 약국, 의료(특별 키워드)
8 + 2 + 24 = 34
total = 307 + 281 + 157 + 43 + 67 + 34
print(f"총 빈도수: {total}")
print(f"자연환경 가중치: {307/total}")
print(f"관광지 가중치: {281/total}")
print(f"맛집 가중치: {157/total}")
print(f"문화환경 가중치: {43/total}")
print(f"생활/편의 가중치: {67/total}")
print(f"보건/의료 가중치: {34/total}")
>>>
총 빈도수: 889
자연환경 가중치: 0.34533183352080987
관광지 가중치: 0.3160854893138358
맛집 가중치: 0.1766029246344207
문화환경 가중치: 0.048368953880764905
생활/편의 가중치: 0.07536557930258718
보건/의료 가중치: 0.03824521934758155
단순히 빈도수만으로 가중치를 부여하기엔 무리가 있다고 생각합니다. 선정하는 단어에 따라서도 결과가 달라질 수 있고, 언급된 기사 수를 기준으로 하지 않고, 기사에 드러난 각 토큰의 빈도수를 기준으로 결과를 보면 가중치가 또 달라집니다.
그럼에도 해당 키워드가 언급된 워케이션 기사 수를 기준으로 가중치를 부여한 이유는 자료 조사와 뉴스 기사 분석 결과를 참고할 때, 모든 특성이 동일한 비중으로 활용되어선 안된다고 판단했기 때문입니다.
그렇다고 단순히 직관에 미루어 가중치를 주는 것은 너무 단순한 접근이라고 느껴졌고, 토큰의 빈도수를 기준으로 가중치를 주려고 했을 땐 특정 키워드의 빈도수가 너무 높게 나타나 가중치 편차가 너무 커져서 사용하기에 곤란했습니다. 그래서 키워드가 언급된 기사 수를 기준으로 가중치를 부여하였으나, 휴리스틱하게 가중치를 준 꼴이 되었습니다.
그러나 앞서 분석을 통해 판단한 중요도(1. 자연, 경관, 2. 관광, 체험 … ) 를 가중치에 반영하여, 가중치를 전혀 주지 않는 것보다는 입지 선정에 도움이 될 것이라고 판단합니다.
이러한 과정을 거쳐 다음과 같은 워케이션 입지 선정 인덱스를 산출하였습니다.
weighted_features = MinMaxscaled_workation[['자연환경', '관광지', '맛집', '문화환경', '생활/편의', '보건/의료']]
weighted_features['자연환경'] = weighted_features['자연환경'] * 307 / 889
weighted_features['관광지'] = weighted_features['관광지'] * 281 / 889
weighted_features['맛집'] = weighted_features['맛집'] * 43 / 889
weighted_features['문화환경'] = weighted_features['문화환경'] * 67 / 889
weighted_features['생활/편의'] = weighted_features['생활/편의'] * 157 / 889
weighted_features['보건/의료'] = weighted_features['보건/의료'] * 34 / 889
weighted_features['total'] = weighted_features.sum(axis=1)
weighted_features.sort_values(by='total', ascending=False).head()
선정 결과 확인
워케이션 입지 선정 인덱스를 적용하기 앞서, 21년 8월 당시 군산시 빈집데이터현황에 있는 151개의 빈집 별 주소와 네이버 거리 뷰를 통해 모든 빈집 실물을 보며 실제로 존재하는지 다시 한번 확인하였습니다.
모든 빈집이 존재하는 것을 확인하고 입지 선정 인덱스를 적용해보았습니다.
워케이션 지수 상위 10개 빈집을 보면 자연환경과 가깝고 관광지, 편의시설, 맛집 등이 주로 분포 하는 지역이 우선시되고 있음을 확인할 수 있습니다.
가중치가 높았던 자연환경 특성을 따라 확산하고 지수의 우선 순위에 맞춰 확산하는 모습입니다. 여행객들이 필요로 하는 요소들을 충족시키는 지역이 상위에 위치하고 있음을 확인하였습니다.
해당 결과를 바탕으로, 지수 순서대로 빈집이 확산되는 지역의 추이를 보며 어느 지역을 우선시 하여 워케이션 입지를 선정하면 좋을지 판단해 볼 수 있습니다.
최종 입지 선정
워케이션을 위해 업무 공간을 마련하기 위해서 워케이션 숙소로써 최소한의 공간이 확보되어야 할 것입니다. 이점을 고려하여 연면적 150제곱미터가 넘어가는 12개 빈집만을 최종 입지 선택지로 두었습니다.
12개 빈집에 대해 워케이션 인덱스 기준 내림차순으로 나열한 결과 5개 빈집을 워케이션 입지로 최종 선정하였습니다.
다섯개의 빈집은 자연 환경과 어우러진 위치, 관광지 인접성 등 워케이션 주요 특성과 넓은 연면적을 만족합니다.
군산의 주요 생활 지역과 교외 지역까지 포괄하며 특정 지역에 편중되지 않은 지역 경제 활성화가 기대됩니다.
마지막으로
대회 기간은 한달 반 정도로 꽤나 길었지만, 준비하다보니 주어진 시간이 많이 부족하게 느껴졌습니다.
군산 경제에 필요한 게 무엇인지 고민하는 과정도 쉽지 않았고, 어렵게 선정한 아이디어를 데이터 기반으로 풀어갈 방법을 제안하는 것도 쉽지 않았습니다.
대회에서 제안한 ‘워케이션 입지 선정 인덱스’는 개선할 점이 많다고 생각합니다. 먼저, 뉴스 기사만으로 분석한 것이 아쉽습니다. 기사 외에도 블로그 포스팅, 인스타그램 같은 SNS 텍스트도 함께 분석할 수 있었다면 현실을 더욱 잘 반영한 결과를 확인할 수 있었을 것입니다. 또한, 가중치를 부여하는 방식이 체계적이지 못하기 때문에 근거가 부족하고, 워드클라우드와 Word2Vec 결과를 해석하는 과정에서도 개인적인 판단이 많이 녹아 있다고 생각합니다. 이러한 부분은 판단하는 사람에 따라 해석이 크게 달라질 수 있기 때문에 결과의 신빙성을 저해합니다.
워케이션 입지 선정 인덱스 외에도 우리가 제안한 문제를 해결할 더욱 효과적인 데이터 기반 방법론이 있진 않을까하는 아쉬움도 있습니다. 당시 역량으로 최선을 다했지만, 더 매력적인 솔루션을 제안할 수 있지 않았을까하는 생각이 듭니다.
아쉬운 점은 많지만, 현실의 문제를 해결하기 위한 솔루션을 고민하고 데이터 기반 해결책을 제안해보며 공부한 지식을 실제 문제 해결에 활용해 볼 수 있었던 좋은 경험이었습니다.
끝까지 포기하지 않고 함께 대회를 마무리한 팀원들에게 고맙고, 좋은 대회를 제공해준 과기정통부와 NIA에 감사합니다.