저자 보상과 스팀 파워는 상관관계가 있을까? -보고서 (초안)-
안녕하세요 @jingdol 입니다
어제 @yoon 님께서 "저자 보상과 스팀 파워는 상관관계가 있을까?" (https://steemit.com/kr/@yoon/77wp9d) 관련해서 통계를 추출해 주실수 없냐구 여쭈어 보시더군요^^ 일단 yoon님께서 작성하신 글을 읽고 제가 지금까지 보고서 작성하면서 수집한 데이터 및 지표로 통계치를 내보았는데 제가 @yoon님의 의도를 제대로 파악했는지 모르겠네요 (한국말이 약해서 ㅠ.ㅠ)
@yoon님 글에서 추출한 내용들을 요약하자면
- 저자 보상이 '자본'과 상관 관계가 있을까?
- 저장 보상이 '자본'에 의해서만 발생한다고 보지는 않습니다. 저자 보상과 스팀 파워 보상의 상관 관계는 그 사이 어딘가에 있을 거라 생각합니다.
위 내용을 제가 받아들은 바로 풀이 하자면
"저자보상에 영향을 주는 요소들은 무엇이며? 그리고 주요요소중에 하나인 '자본' 즉 스팀파워는 어느 정도의 영향력을 미칠까?"
@yoon님이 리스트 한것중에 현재 제가 가지고 있는 데이터로 도출해내지 못하는 부분도 있으니 참고 하시고, 이 보고서를 어제 밤 퇴근후에
시작한거라 어제 부터 관련 데이터를 수집하고 있습니다.
그럼 일단 제가 지금까지 도출한 결과 보고서(초안) 입니다.
데이터
아래 내용은 다음 데이터를 가지고 추출하였습니다.
-글 작성자 760명
-총 글수 4678 (2017-08-14 ~ 2017-08-29)
스팀파워(가로축)와 저자 보상(세로축) 그래프
*VESTS는 스팀잇 상에서의 영향력 그리고 *Author Awards는 저자 보상입니다. X, Y축 모두 로그 변환된 값입니다. 여기서 VEST값이 약16(log)부터 점점 올라가는 추세를 보여주네요.
VESTS의 영향력을 보기 위해서 VESTS기준으로 5개의 나누어 살펴 보겠습니다.
(그룹을 나눈 기준을 단순하게 최대/최소 값을 5구간으로 균등하게 나눈 겁니다^^)
#VESTS 그룹별 보상
위 챠트는 그룹별 보상의 분포 및 Outlier를 나타내는데요. 단순해 보이지만 엄청나게 큰 의미를 지니고 있습니다. 일단 보시면 1번과 2번 그룹에 많은 빨간색 점들이 보이시나요? 이 점들의 의미를 단순하게 생각하시면 특정 집단에서 유별난 얘들입니다.
즉, 1번과 2번 그룹은 스팀파워가 적은 유저들의 집단을 의미 하는 것인데, 그 안에서 적은 스팀 파워를 가지고도 많은 저자 보상을 받아가는 사람들이 존재 한다는 것입니다 (글을 잘쓰는 사람들이 있다는 의미겠죠^^)
위 그래프에서 보여주는 것이 하나 더 있습니다. 그리고 저는 개인적으로 이 의미가 앞에 말씀드린 내용만큼 크다고 생각하는데요. 바로 일정 스팀 파워이상을 보유하신 분들의 저자보상이 일정 금액 이상을 유지 한다 라고 받아 들여집니다.
또한 스팀 파워를 많이 가지면 가질수록 저자 보상은 늘어납니다(이건 당연하다고 생각 하시겠죠?). 그렇지만 2번 그룹과 3번그룹의 보상폭이 엄청나게 크네요. 그리고 1번 2번 그룹의 Outlier가 많다는 이야기는 다시 말하면 저자 보상이 불규칙적이다라고 보실수도 있습니다. 반면 상위 그룹들은 아주 안정적이죠.
저자 보상에 끼치는 주요 요소
"2번째 내용 - 저장 보상이 '자본'에 의해서만 발생한다고 보지는 않습니다. 저자 보상과 스팀 파워 보상의 상관 관계는 그 사이 어딘가에 있을 거라 생각합니다" 관련해서 그럼 여기서 제가 몇가지 낸 지표를 가지고 조금더 들어다 보겠습니다.
글이 "좋다" "안좋다" 를 판별 하기에는 어려움이 많습니다. 그렇다고 손놓고 앉아 있을수는 없으니^^
예전부터 저는 글에 "정보력"을 나타내는 지표 몇개를 계산해서 수집하고 있었습니다.
(아직 보완이 필요하지만 일단 현재 수집된 내용을 가지고 분석해 보겠습니다)
글의 정보력을 나타내기 위해 추출한 지표들
-보팅 수 = VotCnt
-글에 담긴 이미지 수=ImgCnt
-제목의 정보력(WordCount) = TitleLv
-글의 정보력 = bodyLineCnt(양) / ContentsLv (내용=유니크 워드 카운트 / 총 워드 카운트)
위 챠트는 각 그룹(상단 왼쪽부터 그룹 1(하위 VESTS) 하단 오른쪽)의 글의 정보력 및 스팀파워 와 저자 보상에 상관도를 보여줍니다.
각 챠트의 상단 첫번째 줄을 보시면 되는데요. 왼쪽에 (Award)와 각 변수간에 상관도를 보여주는데 파랑색이 짙에 질수록 강한 상관관계를 그리고 빨강색이 짙에 질수록 역 상관 관계를 나타냅니다. 예: 1번그룹에는 bodylinecnt가 꽤 긍정적인 상관도를 부여주느데요, 이는 컨텐츠 양이 커질수록 보상이 대채로 올라간다는 의미를 부여합니다.
Tree - 의사 결정나무
위 의사 결정나무는 글이 어떤 보상(맨 아래)을 받게되는지 변수별로 분류를 해서 보여주는 건데요 상단에 VEST가 위치한걸로 보면 VEST가 가장 큰 영향력을 나타내고 있네요. ^^
와 엄청난 분석이네요. 감사합니다. 스팀파워와 저자 보상의 상관관계는 뚜렷하게 드러나는군요. (하지만 이를 스팀파워가 때문에 저자 보상이 많아진다는 인과관계로 보기에는 무리가 있겠죠.) 자료 감사합니다. tip! 1.0
2번 3번 그룹 차이가 인상적이네요 로그 스케일이니 ㄷㄷ
복잡하군요
여하튼 글은 많이 잘 써야 하는군요
역시 고래와 높은 업보팅 포스팅에 몰리는군요.
제 체감상 보팅이 높은글에 보팅한다고 해서 막 차이날정도로 크게 돌아오는것은 아닌것 같던데
감사히 보았습니다. 스파가 많으면 대체로 글보상도 많습니다.
Hi @jingdol! @yoon is sending you 1.0 SBD tip and @tipU upvote :)
send tips with @tipU | earn interest in @tipU profit
확실한 상관관계를 보이는군요 ㅎㅎ 대단한 자료 만들어주셔서 감사합니다
비례관계라고 생각했는데 일단 진짜로 그래보이는군요. 보고서의 완성이 기대되네요
와.. 통계학이나 프로그래밍을 전공하신건가요?
정말 깔끔한 정리 감사합니다 업보트 하나 하고 갑니다. 대단하세요!!