토론:긴 꼬리/보존 1

마지막 의견: 16년 전 (Alfpooh님) - 주제: 개선안 (1)

롱테일의 의미

[롱테일의 의미] 부분에서 책을 예로 들었는데 교보문고 매장에 진열되어있는 모든 책이 머리(20%)에 해당하고 진열조차 되지 않은 많은 부분이 꼬리라고 하였는데 이부분에서 생각을 좀 해봐야 할것 같습니다. 머리, 즉 상위 20%의 책들이 매장 수익의 80%를 차지한다는 데에는 이견이 없을 것입니다. 여기서 꼬리는 단 한번 팔리거나 또는 한번도 사람들이 찾은 적이 없는 책입니다. 매장에 진열되어 있는 모든 책이 두권 이상 팔려서 '머리'에 해당 할까요? 이번엔 규모가 작은 동네 서점을 생각해봅시다. 창고가 별도로 없고 진열되어 있는 책이 전부입니다. 여기서도 여지없이 한번 팔리거나 아무도 사지 않은 책은 꼬리를 형성하고 있고 20%의 책(베스트셀러)들이 머리를 맡습니다. 대부분의 경우에서 20:80 법칙이 성립하는데 교보문고에서 안팔리는 책을 창고에 넣어둔다고 해서 매장에 진열된 모든 책들이 모두 머리가 될까요? 아무리 걸러내고 걸러낸다 하더라도 그 안에서 또 20:80이 생겨날것입니다.

진열조차 되지 않은 많은 부분이 꼬리라고 한것은 롱테일부분과 기존 파레토에서 꼬리가 섞여있어 의미 전달이 잘 안되었습니다. On-line 매장에서 진열이 된 부분이 기존 꼬리입니다. 매장의 한계로 인해 진열할 수 없는 부분까지 합친 부분이 롱테일 (긴꼬리)입니다. 매장의 한계로 인해 진열할수 없는 책들은 off-line을 통해 진열이 가능하므로 꼬리를 길게 할 수 있습니다. On-line에서 접근 방법은 여러 매장을 묶어서 큰 매장화한다든지 작은 매장이라도 진열 방식을 바꾼다던지 함으로 꼬리를 늘릴 수 있습니다. 롱테일은 꼬리를 늘린다는데 의미가 있습니다. 파레토 법칙은 상위 부분에 집중하면 생산성을 높임을 내포하고 있었습니다. 실제 상황은 이론적인 상황과 다를 수 있기 때문에 롱테일의 맹신도 바람직 해보이지는 않습니다.Jamessungjin.kim 2008년 2월 7일 (목) 12:59 (KST)답변

이글을 보시는 여러분은 어떻게 생각하시나요?

전통적으로 20/80 법칙이라 해서 잘 팔리는 20%에 주목해 왔습니다만, 아마존 등을 통해 안 팔리는 50 쪽이 실제로 수익을 낸다는 게 밝혀졌죠. 네트워크 이론의 핵심입니다. 잘 팔리는 20%는 30-40%씩 과감하게 할인을 해서 판매해 판매량은 많지만 수익이 많지 않습니다. 하지만 일년에 1-2권 팔리는 책은 오히려 배송료까지 붙여 팔아도 살 사람은 삽니다. 이게 이제까지는 "틈새 시장"이라고만 알려졌지만 실제로는 빙산의 몸통이라는 거죠. 단지 시장에서 대접을 못 받았을 뿐.. -- ChongDae 2006년 11월 27일 (화) 16:34 (KST)답변
이 부분이 롱테일 이해를 햇깔리게 하고 있습니다. 통계를 책의 매출로 보면 순이익과 안맞을 수 있다는 해설입니다. 이도 롱테일의 한 해석으로 볼 수는 있습니다만 진정한 롱테일로 보기는 힘들어 보입니다. 시중에 나와 있는 책들 중에는 롱테일을 이렇게 해석하는 책들도 있습니다. 그런것은 파레토 시절에도 있는 오류이기 때문입니다. 고객이 선호하는 자동차의 색깔로 통계를 내고 이 통계가 자동차 매출과는 상관도가 높지 않다 그래서 사람들이 싫어하는 색깔들인 테일 부분에서 매출이 전체 매출의 50% 이상이다라고 주장할 수 있습니다. 이도 테일의 상승으로 볼 수 있지만, 온라인을 통한 테일의 길이를 늘려 아주 긴 즉 롱테일에 의한 효과를 설명하기 에는 부족함이 있습니다. 저도 통섭은 공부하고 있습니다만, 통계학을 직접 전공하지 않아 이해에 오류가 있을 것 같습니다. 다른분들은 어떻게 생각하시는지요? Jamessungjin.kim 2008년 2월 7일 (목) 12:52 (KST)답변
크리스 앤더슨은 롱테일은 20/80이 존재하는 환경에서 이론을 말하고 있습니다.

안 팔리는 80은 '자주' 그리고 '많이' 안 팔리는 것이지 안 팔리는게 아닙니다. 교보문고의 진열대에 없는 것이지 인터넷 교보의 물류 창고에서 팔리는 것입니다. 아마존이 성공하고 넷플릭스가 성공한 것도 다 온라인 매장이라는 점에서 그리고 책과 독자를 연결시켜 준다는 점에서 롱테일이 성립하는 게 아닐까요? 아쉽게도 국내 온라인 서점의 경우, 저런 롱테일 독자들은 자신들이 필요하면 국내 번역서보다는 원서를 바로 구매해버리는 점 때문에 롱테일이 늘어지기 힘든게 아닌가 합니다. 국내 문화 및 독서 스펙트럼의 폭이 글로벌로 본다면 좁을 수밖에 없죠. 그리고 롱테일은 글로벌 네트워킹 위에서 성립 되는 것이 아닐까요? -- 사용자:Deepthroat81 2007년 6월 21일 (목)

롱테일은 일련의 기술적 발전 즉 인터넷 쇼핑몰과 같은 유통구조의 혁신등에 기반하여 새로운 기회가 열리는 것을 설명하고 있습니다. 이러한 가정없이는 일반적인 가정인 베스트셀러에 한정된 자원을 집중하는 것이 맞겠지요. --Alfpooh 2008년 2월 7일 (목) 13:09 (KST)답변
잘 지적하였네요. 저는 앞서 기술의 발전이라고 설명한 부분을 제품 제조의 기술의 발전으로 잘 못 생각했었습니다. 마케팅 기술의 발전을 의미하는 것이겠지요? Jamessungjin.kim 2008년 2월 7일 (목) 13:21 (KST)답변
크리스 앤더슨은 전국적 택배망 같은 유통기술, 마케팅기술도 포함된다고 했군요. 특히 제품제조 기술의 발달은 맞춤형 제품기술의 발달로 저렴한 비용으로 만들때에도 충분한 이익을 낼 수 있다면 롱테일이라고 봐야겠지요.--Alfpooh 2008년 2월 7일 (목) 13:28 (KST)답변

수학적 해설에 관한 토의 제의

다음은 수학적 해설의 초기 버젼입니다. 바뀐 버젼과 일부 차이가 있어 토론 주제로 올립니다. 롱테일을 제안한 크리스엔드슨이 새로운 롱테일 분포를 제안하지 않고 파레토와 차이점만 설명하였기 때문에 설명이 여러갈래가 되고 있습니다. 파레토 법칙에서는 테일부분의 합이 전체의 20%에 불과했지만 롱테일에서는 테일부분의 합이 99%가 된다는 것은 현상입니다. 이를 수학적으로 모델링하기 위해서는 롱테일 분포가 필요합니다. 그렇지 않고 파레토 분포로 설명하게되면 여전히 롱테일 부분은 20%에 해당하게 됩니다. 따라서 아래에서는 파레토와 비교 편의를 위해 파레토 분포로 설명한 것입니다. 파레토 분포를 사용할 수 있는 근거는 파레토 분포가 내재하고 있는 확률이 통계학계의 만고불변(?)으로 여겨지는 정규 분포를 사용하고 있기 때문입니다. 정규 분포는 centeral limit theory에 근거하여 모든 분포의 기본으로 볼 수 있읍니다. 하지만 실제 상황의 분포 모양은 정규 분포와 일치하거나 약간 다르거나 아주 다를 수 있기 때문에 설명시 사건이 어떤 분포를 가정하고 설명하고 있다는 것을 예시하여야 합니다. 만약 정확한 분포 측정이 되지 않거나 만들기가 힘든 경우에는 잘 알려진 분포를 사용하고 그 분포와 유사할 수 있는 이유에 대해 귀납적 논리를 확보해야 합니다. Jamessungjin.kim 2008년 2월 7일 (목) 12:44 (KST)답변

수학적 해설 초기 버젼

파레토와 롱테일은 경제 현상에 나타나는 확률적 특성을 나타내는 것이며 가우시안 분포에 발생 빈도를 고려하여 유도한 파레토 분포로 설명 된다. 우선  를 양의 파레토 분포 함수라 하고 아래와 같이 표현된다.

 

여기서  k는 파레토 분포의 상수이다.  는 0에서 양의 무한대까지 실수로 표현되는 사건이다. 두 현상에 대한 설명을 위해  라는  축에 해당하는 세 변수를 정의한다. 여기서  는 지금까지 다루는 총 묘수를 의미한다.  는 주어진  범위안에서 상의 20%에 해당하는 사건이다. 서점의 책 판매를 예로들면 잘 팔리는 순으로 책을 정리한 경우  가 서점내의 마지막 순번째 책이라면  는 0.2*T번째 잘팔리는 책의 순번에 해당한다. 일반적으로 잘 팔리는 책을 눈에 잘뛰는 곳에 전열해 둠으로 상위  까지 책을 아는 것은 중요했다. 이렇게 잘 팔리는 상위권 책을 구분하여 보는 것이 파레토의 기본 개념이다.

롱테일에서는  보다 큰 값인  이 중요하다. 잘 팔리는   순번까지 책도 중요하지만 고객과 접할 수 있는 전체 책의 수인   로 늘여주는 것도 이익 창출에 중요한 요소가 된다는 점이다. Off-line 매장에서는  를 크게 늘려주는 것이 쉽지 않지만 인터넷상의 on-line 매장에서는 비교적 쉽다. 이렇게  을 늘려 전체 묘수가 크지게 되면 앞서  가 차지했던 비중은 줄어든다.

온라인 서점의 경우  을 크게 늘렸더니   이후의 책들에서 나온 매출이 95%이상이 되었다는 보고도 있다. 이는 분포식으로도 쉽게 증명이 가능하다. 우선 설명을 위해 파레토 확률 분포의 누적 분포를 아래와 같이 정의하자.

 

이때  가 되는 위치와  가 되는 위치가 각각 파레토와 롱테일의 효과를 설명한다.

당연할 것 같으면서도 새로운 롱테일 효과는 수학적으로 설명되었듯이 묘수를 매우 크게 늘릴 수 있으면 상위부분의 소수에 집중하는 것만으로 얻을 수 없었던 새로운 경영 이익을 기대할 수 있음을 의미한다.

수학적 설명 부분

외람됩니다만 사용자:Jamessungjin.kim님이 편집하신 수학적 설명 부분의 개선이 필요하다고 생각합니다. 일단 토론에서 개선안을 찾아 보도록 하면 어떨까요?

찬성합니다. 새롭고 어려운 경제학적 현상에 관한 것이라 롤링 스노잉에 근거한 다수의 협력 (Group genenious)이 필요하다고 봅니다. Jamessungjin.kim 2008년 2월 7일 (목) 13:06 (KST)답변

다음은 2008년 2월 7일 현재의 편집본입니다

"이러한 파레토 분포에서 롱테일 현상을 설명하기 위해   축 위에 있는 3가지 변수를 설정한다.  은 상당히 많은 경우의 모수를 의미한다. 예를들면 L은 존재하는 모든 경우의 모수가 될 수 있다.  는 실제적으로 다루는 것이 가능한 경우의 수를 의미한다. 예를들면 off-line 서점에서 다룰 수 있는 모수이다. 확률이 높은 순으로 정리된 파레토 분포의 표에서  번째의 사건은 마지막 순번이 된다.  는 주어진  범위 안에서 상위 20%에 해당하는 것이다. 파레토 법칙에 따르면  의 관계가 성립한다. 반면, 롱테일 주장에 따르면  까지 합해진 확률 누적분은  에서   까지의 구간의 확률 총합과 비교 할 때 대등하거나 더 많을 수 있다. 이런 현상은 on-line의 이용등 기존 체제의 한계 극복에 의해 가능하다. 여기서 확률 누적치는 매출액, 순익등이 해당한다. 파레토 법칙과의 비교를 위해 파레토 분포를 사용하기 위해 변수 T를 사용하였으나, 롱테일 분포를 새로 정의하게되면 T를 무시하고 PL로만 설명이 가능하다. 롱테일 현상은 L까지 확률 누적분인 꼬리 부분 누적치는 P까지 확률 누적분인 머리 부분의 누적치보다 훨씬 많은 상태이다. 이론적으로는 사용하는 체계에 따라 롱테일 부분의 양은 95~98%에 달하게 될 수도 있다."

저의 개선안 (1)입니다

  1. .먼저 L이 전체 모수라면 변수일 필요가 없기 때문에 생략하도록 합니다.
    L에 대한 정의를 명확하게 하거나 T  로 구분하는 방식은 어떤가요? T를 하나만 정의하게되면 PT -> L로 크진 경우에 대해서는 20%에 해당하는 것으로 오해의 소지가 있거든요. 여기 L은 off-line등 (또는 경영 혁신)으로 T를 늘려준  를 의미하고 있습니다. 설명하는 방식은 여러가지 있을 수 있으니 제가 접근하고 있는 설명 방법만이 아니라고 생각하고 있으니 자유로운 토의가 되면 좋을 것 같습니다.. Jamessungjin.kim 2008년 2월 7일 (목) 13:19 (KST)답변
  2. .확률 비교 구간을 명확히 해야할 필요가 있습니다.
  3. . P의 정의가 상위 20%인 만큼 P에서 T까지의 양은 따라서 80%로 고정됩니다.
  4. . 다만 여기서 P의 위치는 전체 모수가 늘어나고  의 확률적 발생 한계가 기술적 발달에 의해 극복될수 있다는 전제에 의해 변하게 됩니다. 하지만 P의 위치는 실제로 변화가 크지 않고 P와 T사이의 확률분포 그래프가 길게 늘어나고 이부분의 확률적 사건들에 의한 결과(예:매출액)이 상위 20%까지의 확률적 사건들에 의한 결과 즉 최좌측에서 P까지의 확률 누적분에 의한 결과 (예:매출)과 같거나 오히려 많을 수 있다고 "롱테일"에서는 주장합니다. 여기서 수학적으로 확률누적분이 그 사건의 확률적 결과인 매출에 양의 관계를 가집니다만... 어떤 결정적 함수관계를 가진다고 결정하기는 어렵습니다. 비지니스 케이스 별로 틀리겠지요.
  5. 상위 20%의 도수의 확률분포의 결과를 베스트셀러 매출액으로 예를 들때 롱테일 현상에서는 나머지 80%에서 경제적으로 만족할 만한 매출액 심지어 같거나 더 많을 수도 있다는 주장을 한다고 봐야 할것입니다. 꼭 같거나 많아야만 경제적으로 롱테일 부분이 의미가 있는 것이 아니라 경제적인 효과를 보는 지점은 좀더 작아도 괜찮기 때문입니다. 그러나 이부분은 경제학적 관점이 될것입니다.


"어떤 사건들을 파레토 분포로 나타났을 때  는 그래프의 X축에서  는 실제로 존재하는 마지막 도수로 최우측에 그려진다.  는 가장 빈번한 확률인 최좌측 도수에서  까지의 범위 안에서 누적된 도수인 상위 20%의 확률분포에 해당하는 것이다. 파레토 법칙을 따르면  의 관계가 성립한다. 즉 전체 모수의 누적확률분포의 80%는 가장 최상위 확률도수에서  까지 구간의 누적확률분포와 같다. 롱테일 현상 에서는  에서  까지의 분포가 더 길게 늘어 질 수 있는데 그 이유는 실제적 확률을 결정짓는 한계  가 기술적 발달에 의해 극복될 수 있다고 주장하기 때문이다. 또한 이러한 기술적 발달은 전체 모수를 늘리는 효과를 가져온다. 이러한 누적확률분포 상위 20%의 사건들(예:판매)이 결과(예:판매액)로 이어져 누적된 양(예:상위 20% 베스트셀러의 매출액)이 나머지 80%의 누적확률분포에서 비롯된 사건들의 결과에 의한 양(예:하위 80%의 매출액)과 비교하여 충분한 경제적 이익을 내거나 심지어 대등하거나 오히려 많을 수 있다고 주장한다."

저의 개선안 (2)입니다

"어떤 사건들을 파레토 분포로 나타났을 때  는 그래프의 X축에서  는 실제로 존재하는 마지막 도수로 최우측에 그려진다.  는 가장 빈번한 확률인 최좌측 도수에서  까지의 범위 안에서 누적된 도수인 상위 20%의 확률분포에 해당하는 것이다. 파레토 법칙을 따르면 .   으로 표현되고 즉 전체 모수의 누적확률분포의 80%는 가장 최상위 확률도수에서  까지 구간의 누적확률분포와 같다. 롱테일 현상 에서는  에서  까지의 분포가 더 길게 늘어 질 수 있는데 그 이유는 실제적 확률을 결정짓는 한계  가 기술적 발달에 의해 극복될 수 있다고 주장하기 때문이다. 또한 이러한 기술적 발달은 전체 모수를 늘리는 효과를 가져온다. 이러한 누적확률분포 상위 20%의 사건들(예:판매)이 결과(예:판매액)로 이어져 누적된 양(예:상위 20% 베스트셀러의 매출액)이 나머지 80%의 누적확률분포에서 비롯된 사건들의 결과에 의한 양(예:하위 80%의 매출액)과 비교하여 충분한 경제적 이익을 내거나 심지어 대등하거나 오히려 많을 수 있다고 주장한다."

개선안 (2) 수정해 본 것입니다

개선안 (2)를 추가 및 수정해 보았습니다. 여러번 디스켜션하니 정답에 점점 근점해나간다는 느낌이 드네요. 제품 제조 기술의 발달은 롱테일의 매출을 늘릴 수 없다고 생각되는데, 이 부분에 대한 의견은 어떠신지요? Jamessungjin.kim 2008년 2월 7일 (목) 13:38 (KST)답변

제품제조기술의발달은 많은 경우 제품단가하락을 가져오고 (그럴려고 죽어라~ 고생하죠 ^ ^;) 단가하락은 전체판매에도 영향을 끼치긴 하지만 다른 한편, 소품종다량생산을 가능하게 하는 결정적 계기가 됩니다. 예를 들어 플라스틱 금형의 발달이 생활용품에 끼친 영향입니다. 따라서 롱테일의 매출을 늘린다고 직접적으로 볼수는 없지만 롱테일의 꼬리를 길게 만드는 역할은 분명히 기여하고 있다고 생각됩니다.--Alfpooh 2008년 2월 7일 (목) 13:50 (KST)답변
상당히 중요한 예이네요. 모어스룰이 적용되어 제조단가가 낮추어지고 freeconomics 시대가 열리게되는 시나리오 이네요. 저도 그 부분을 설명에 포함하고 싶은데 어쩐지 쉽지 않네요. 아마 우리가 좀 좋은 결론들에 도달하게 되면 기존의 파레토식 설명과 또 다른 통계를 도입한 설명으로 나누어서 설명해야 할 듯 싶습니다. 현재로선 저는 둘을 한 방법으로 설명할 아이디어가 없네요. 기존 이성적 수학의 한계가 아닌가 싶습니다. 전문 분야가 다른 사람들과 수학을 통해 같은 것을 표현하려고 할 때 설명은 할 수 있어도 싶게 융화하기는 어렵다는 문제인 것 같아요. Jamessungjin.kim 2008년 2월 7일 (목) 13:58 (KST)답변
  • "어떤 사건들을 파레토 분포로 나타났을 때  는 그래프의 X축에서  는 실제로 존재하는 마지막 도수로 최우측에 그려진다.  는 가장 빈번한 확률인 최좌측 도수에서  까지의 범위 안에서  와 같이 누적된 도수인 상위 20%의 확률분포에 해당하는 것이다. 파레토 법칙을 따르면 . 'P'와 'T'는 누적 확률 분포에 있어서는 으로 표현된다. 즉 전체 모수의 누적확률분포의 80%는 가장 최상위 확률도수에서  까지 구간의 누적확률분포와 같다. 롱테일 현상 에서는  에서  까지의 모수가  처럼 훨씬 더 길게 늘어 질 수 있는데 그 이유는 실제적 확률을 결정짓는 한계  가 마켓팅 기술의 발달에 의해 극복될 수 있기 때문이다. 새로운 마켓팅 기술의 한 방법으로는 web 2.0등 오프라인 방법이 있다. 또한 다양성등 새로운 사회의 요구로 인해 테일 부분의 가치가 상승하는 효과를 가져오는 것도 한 이유이다. 이러한 누적확률분포 이전 상위 20%의 사건들(예:판매)이 결과(예:판매액)로 이어져 누적된 양(예:상위 20% 베스트셀러의 매출액)이 길어진 꼬리 부분의 누적확률분포에서 비롯된 사건들의 결과에 의한 양(예:이전 하위 80%에 새로운 꼬리 확장으로 생긴 매출액)과 비교하여 충분한 경제적 이익을 내거나 심지어 대등하거나 오히려 많을 수 있다고 주장한다."

개선안 (3)

조금 더 정리해 보았습니다. 아직 수학적 설명에 너무 경제적 관점이 들어간게 아닌가..불만족스럽군요.--Alfpooh 2008년 2월 7일 (목) 14:04 (KST)답변

  • "파레토 분포로 어떤 사건들을 나타났을 때  는 그래프의 X축에서 실제로 존재하는 마지막 도수로 최우측에 그려진다.  는 가장 빈번한 확률인 최좌측 도수에서  까지의 범위 안에서  의 식으로 표현된다. 즉 전체 모수의 누적확률분포의 80%는 가장 최상위 확률도수에서  까지 구간의 누적확률분포와 같다. 롱테일 현상 에서는  에서  까지의 구간이 더 길게 늘어 질 수 있는데 그 이유는 실제적 확률을 결정짓는 한계 기준인  가 새로운 사회의 다양성 요구나 다양한 기술의 혁신에 의해 바뀔 수 있기 때문이다. 이러한 그래프에서 누적확률분포 상위 20%의 사건들이(예:베스트셀러 판매) 결과(예:판매액)로 이어져 누적된 가치(예:상위 20% 베스트셀러의 매출액)가 나머지  에서  까지 구간(롱테일의 꼬리부분)의 누적확률분포 사건들의 결과에 의한 가치(예:이전 하위 80%에 새로운 꼬리 확장으로 생긴 매출액)와 비교하여 충분한 경제적 이익을 내거나 대등하거나 심지어 더 많을 수 있다고 주장한다."--Alfpooh 2008년 2월 7일 (목) 14:04 (KST)답변
현재 수학적 설명 뒤에 추가된 부분은 위의 부분과 잘 맞지 않습니다.

"여기 설명에서는 통계치와 적용치가 순이익으로 일치했지만 설명의 편의를 위해 통계치는 통상적 베스트셀러로 적용치는 매출액이나 순이익으로 다르게 적용하여 설명하는 방법도 있다. 이에 대해서는 수학적으로 전개가 용이하지 않아 설명을 생략한다." 1. 통계치와 적용치가 순이익으로 일치했다는것이 어떤 의미인지요? 순이익은 경제적 관점에서 비즈니스 케이스 마다 모두 달라 일반적인 수학적 설명으로는 적합하지 않습니다. 통계치는 도수를 의미하시는 것 같은데 이를 '통상적 베스트셀러'라고 설명하는 것은 수학적으로나 경제적 설명으로 적절치 않습니다. 적용치라는 것은 어떤 의미인지요? 이 또한 특정 도수부분의 사건이 발생시킬수 있는 매출액 혹은 순이익이라는 의미라고 한다면 '적용'이란 용어는 적합하지 않습니다. 2. 마지막에 설명하셨듯이 수학적으로 전개가 용이하지 않으니.. 수학적 설명에서는 안하는것이 간결하고 도움이 되겠습니다. 3. 파레토 법칙은 수학법칙이 아닙니다. 경험적이고 현상적인 일을 설명하고자하는 가설이므로 파레토 법칙을 수학적으로 응용하는 것은 한정된 가설 안에서 만 쓰여져야할 것입니다. 따라서 이 부분은 삭제할것을 제안합니다. --Alfpooh 2008년 2월 8일 (금) 01:45 (KST)답변

확률과 그 결과

롱테일을 수학적으로 설명할때 헷갈리기 쉬운 부분이 20%와 80%를 결정하는 부분이고 그리고 그 결과에 대한 해석입니다. 일단 그래프상에서 나타나는것은 매출액이 아닌 판매빈도/판매확률이라고 봐야 합니다. 당연히 매출액과는 양의 상관관계를 이루겠지만 단순한 관계는 아닙니다. 따라서 상위20%와 하위80%의 경제학적 비교는 이 누적확률이 발생시키는 매출액에서 이루어져야합니다. (그러나 이부분은 수학적 해석이 아니죠). 또한 경제학적 관점에서는 하위80%의 누적 확률에서 일어나는 매출이 경제적으로 충분할 만큼 즉 투여한 리소스 대비 얻어내는 것이 적절하기만 하면 롱테일 경제가 Make sense 해진다고 봐야 할것입니다. 굳이 같거나 더 클 필요는 없겠지요. --Alfpooh 2008년 2월 7일 (목) 13:05 (KST)답변

파레토 법칙은 수학적인 정의로 보기 힘든 현상인 것이 그 상위 누적 도수 20%가 가치의 80%를 차지한다는 식으로 사회,경제,자연현상들을 설명하려는 가설이기 때문입니다. 이를 파레토 분포에서 설명하려 할때 이 둘을 헷갈리면 안되겠습니다. 즉 파레토 분포상위 누적확률분포 20%가 발생하는 가치가 어떠할건지는 일반적으로 알 수가 없습니다. 다만 파레토 법칙의 설에 따르면 가치의 80%를 발생시킨다는 것이지요.--Alfpooh 2008년 2월 7일 (목) 13:20 (KST)답변
꼬리가 크져버렸다고 보면 (T --> L) 수학적으로 접근이 가능도 하다고 생각합니다. 원 꼬리(T)까지에서만 보면 상위 20%가 80%의 결과를 만들지만 길어진 꼬리(L)에 대해서 이전 꼬리 기준의 20%까지(P)는 수%의 결과만 낸다는 것이지요. 물론 꼬리가 길어진 상황에 대해서 계산해보면 만고불변(?)의 가우시안 특성을 따를때 새로운 머리부분(P_new = 0.2*L)은 역시 80%의 결과를 만들어 내게 되겠지요. 만약 가우시안을 따르지 않는 분포라면 이런식의 설명이 어려울 것 같은데, 이에 대해서는 저도 잘 모르겠습니다. 실제 통계를 좀 조사 봐야 할 것 같아요. Jamessungjin.kim 2008년 2월 7일 (목) 13:27 (KST)답변
단순히 꼬리를 크게 하는 것 즉 여기서 T의 그래프상 분포를 우측으로 미는 효과 만으로도 '롱테일'현상이라 볼수 있지않을까요? 여기서 다시..머리 20%가 80%의가치를 만들어낸다는것은 파레토 법칙의 설인데..수학적이라고 볼수는 없고 실제 사회,경제적 통계에서 이끌어낸 귀납적 일반론이라고 봐야됩니다. 확률적 분포의 머리 부분이 어떻게 실제적 가치 결과인 매출액으로 환산되는가?는 비즈니스 케이스 별로 틀리다고 봐야할 듯 합니다. 또한 여기서 실제적으로 "비즈니스"에 주어진 한정된 자원을 어떻게 사용하는가라는 문제가 있고 실제 비즈니스에서는 상위 20%의 확률분포가 소위 레드오션이기 때문에 하위 80%의 확률분포를 니치시장으로 공략하겠다는 전략적 면이 "롱테일"과 관련된 부분이겠습니다...그러나..이런 시나리오는 수학적 설명이 아닌 경영전략적 설명으로 봐야할것입니다.--Alfpooh 2008년 2월 7일 (목) 13:34 (KST)답변
말씀하신바데로 롱테일은 크라우드소싱 개념이 수반되어야만 가능하다고 봅니다. 현재까지 서점안의 책뿐아니라 외부에 있는 책들을 on-line등의 도움을 받아 활용할 때 비로소 가능해 집니다. 현재 서점에서 가지고 있는 책의 판매 방법을 아무리 조절해도 꼬리 부분의 책들이 머리 부분의 책들보다 많은 이익을 만들 수 없습니다. 단 첫째 통계의 확률값을 잘 못 설정한 경우는 그런 결과를 일부 얻을 수는 있습니다. 둘째 이전에 생각했던 머리 부분에 대해서는 바뀐 마켓팅을 고려할때는 일부 가능합니다. 예를들면 통계낼 때는 구매자가 선호하는 책의 두께로 내고 나중에는 구매자를 통한 순이익으로 내게되면 다른 결과가 나옵니다. 이보다 더 쉬운 예는 매출 기준이 수이익 기준과 다르다는 것입니다. 매출을 많이 했다고 순이익이 많이 나오는 것은 아니기 때문입니다. 그러나 크리스엔드슨은 이런 기존의 잘 못된 통계 현상의 문제점까지도 포함하여 롱테일을 광범위하게 설명한 것 같습니다. 아마 수학적인 접근을 염두에 둔 것이 아니고 2006년이라는 시간적 관련 지식 미성숙에도 기인하지 않았나 생각됩니다. 온라인 지식의 량이 연간 두배씩 증가함을 생각해볼때 2006년의 미래 예측 설명과 2008년의 해설은 다를 수 가 있다고 보여집니다. Jamessungjin.kim 2008년 2월 7일 (목) 13:48 (KST)답변
크라우드소싱은 롱테일을 만들어내는 방법중에 하나이고 위키백과가 그중 가장 적절한 예일 것입니다. 그런데 "통계의 확률값을 잘 못 설정한 경우는~"이란 말씀이 잘 이해 안가는데요. 통계의 확률값은 설정하는 것이 아니라 통계연구에 의해 실험적으로 얻어지는 것이기 때문입니다. 다만 통계에서 분석을 위한 설정값 예를 들어 알파값이나 검정력등을 설정하는 것은 가능하고..ㅎㅎㅎ 이부분을 조작하거나 오해하게 만드는 것은 가능합니다. --Alfpooh 2008년 2월 7일 (목) 14:08 (KST)답변
통계의 확률값은 오기였습니다. 죄송합니다. 통계의 대상을 그만 잘 못 표현했습니다. 통계의 대상을 매출로한 경우와 대상을 순이익으로 한 경우는 롱테일의 누적 확률값이 다를 수 있다는 의미였습니다. 말씀하신 방법에 대해 생각해 보았는데, 온라인 서점에서 권당 수를 줄여 종류를 늘려준 경우도 롱테일 효과의 설명에 포함될 수 있다는 생각을 했습니다. 전체 책의 수는 같지만 종류가 바뀐 것이거든요. 이런 경우는 입력 변수가 두가지로 기존 1차원 파레토 분포로는 설명이 어려울 것 같습니다. 하여간 좀 더 지성이 모여지면 롱테일을 좀 더 잘 표현할 수 있을 것 같습니다. Jamessungjin.kim 2008년 2월 7일 (목) 14:44 (KST)답변

머리와 꼬리

이 부분의 설명이 잘 납득이 안되고 통계적 이론을 적용하는 데 있어 불확실한 면이 많다고 생각되어 개선을 요청드립니다.--Alfpooh 2008년 2월 8일 (금) 02:05 (KST)답변

"머리와 꼬리 롱테일을 이야기할 때 '머리'와 '꼬리'라는 말이 사용된다. 서적 판매의 경우 '머리'는 현재 매장에 많이 진열되어 있는 많이 팔리는 상품들을 말하며 '꼬리'는 상대적으로 판매량이 적은 그 이외의 상품을 말한다. 예를들면 교보문고와 같은 대형 서점에 있는 모든 제품이 '머리'에 속하는데 하지만 우선순위에서 밀려 진열에서 밀린 수많은 다양한 비인기서적들을 '꼬리'라고 보고 롱테일을 설명할 수 있다. 뿐만아니라 '머리'를 베스트 셀러나 사람들이 많이 알고 있는 작품 또는 인기 블로그를 부를 때 쓰고 그 외에를 꼬리라고 보는 경우에 대해서도 롱테일을 설명할 수 있다.

공개된 여러 문서에서 롱테일의 '머리'와 '꼬리'의 의미는 의미 전달을 용이하게 하기 위해 일반 통계학적 의미와는 약간 다르게 사용하고 있다. 일반적으로 통계에서는 분석하고자 하는 사건과 통계를 내는 사건이 동일해야하며, 통계를 통해 랭킹을 매기는 순간과 현상을 설명하는 순간이 일치해야한다. 분석하고자 하는 사건이 순이익인데 통계를 내는 사건이 베스트셀러라면 엄밀한 통계에서는 오류에 해당된다. 하지만 롱테일의 해설에서는 통념상 베스트셀러가 순이익과 유사하리라 보는 시각을 가정하고 있다. '머리'를 정하는 통계 시점과 '꼬리'를 정하는 통계 시점이 시간적 불일치하에 설명되기도 한다. '머리'를 정하는 시점은 오프라인등과 같은 기존 방식의 시스템하에서이며 '꼬리'를 정하는 시점은 온라인등과 같은 새로운 방식의 시스템 하에서라 가정하는 경우가 이에 해당한다. 이는 실생활의 문제가 다양하며 롱테일의 적용범위가 넓음에 기인하며, '머리'와 '꼬리'를 엄밀한 통계학적 의미로 적용해도 롱테일을 설명할 수 있다"

개선안 (1)

"머리와 꼬리 롱테일에서는 '머리'와 '꼬리'라는 용어가 사용된다. 예를들면 교보문고와 같은 대형 서점의 서적 판매 사업의 경우 '머리'는 현재 한정된 공간의 매장에 잘 보이도록 진열되어 있는 비교적 많이 팔리는 상품들이다. 한편 '꼬리'는 상대적으로 판매량이 적어 잘보이지 않게 진열되거나 창고에만 있는 그 이외의 상품을 말한다. 이때 잘 보이도록 한 제품들은 마케팅적으로 집중하는 부분으로 롱테일의 '머리'에 해당하는 제품들이다. 하지만 상대적으로 진열에서 밀린 수많은 다양한 비인기 제품들은 '꼬리'에 해당한다. 대형서점의 한정된 공간과 마케팅 자원 때문에 이런 '머리'에 해당하는 제품들은 베스트 셀러나 사람들이 많이 알고 있는 작품 또는 마케팅적으로 집중 투자하여 성공시키고자 하는 제품들로 여기에 집중된 투자를 하는 것이 일반적으로 효과적인 매출을 창출할 수 있다. 한편 '꼬리'는 구색을 갖추는 제품들로 비용대 효용면에서 상대적으로 비효율적이지만 그렇다고 포기하지는 않는 부분이다." --Alfpooh 2008년 2월 8일 (금) 02:05 (KST)답변

한편 다음의 부분은 출처나 근거가 요구됩니다.--Alfpooh 2008년 2월 8일 (금) 02:05 (KST)답변
어제 오늘 엔드슨의 원본 기사를 다시 정독해보았습니다. 문장 중에 20%를 설명할 때는 hit (베스트셀러)로 설명하고 있습니다. Only 20 percent of major studio films will be hits. 이를 순이익과 동시에 연결하고 있습니다. "fewer than 10 percent are profitable". 아마도 베스트셀러가 순이익을 가져다준다는 통념을 인정하고 혼합하여 적은 듯합니다. 사실 대부분은 사실이겠지요. 하지만 롱테일의 경우 고객의 다양성에 대한 요구로 매출과 순이익을 가져다준 제품이 유사하다는 통념이 깨우질 수도 있다는 것입니다. 수학적 설명의 토의에서도 잠시 설명했지만 롱테일은 테일을 길게하는 부분과 테일을 굵게하는 부분으로 나누어서 설명할 필요가 있다고 생각합니다. 의견이 어떠신지요? Jamessungjin.kim 2008년 2월 8일 (금) 10:10 (KST)답변
말씀하신대로 일단 크리스의 책이나 기사에서도 이부분을 정의하는데 엄밀함이 좀 떨어지는 느낌입니다. 예를 들어Hits는 여러의미가 있으나 일단 Make profit 혹은 Successful as expected정도로 생각해야할 듯 합니다. 여기서 매출과 순이익은 경제학적 관점에 봤을 때 일반적으로 깊게관련되어 있으나 단정적으로 말하긴 힘들고 "롱테일"의 설명에서는 매출로만 잡는 것이 좋겠습니다. 왜냐하면 순이익은 비즈니스케이스별로 틀리기 때문입니다. 실제로 "롱테일"비판하는 사람중에는 매출만 있고 적절한 순이익을 창출할수 없는 경우가 첫번째 인터넷 버블 시절에 있었다고 합니다. "롱테일"효과가 실제로 나기 위해서는 "누적된 80%의 부분을 크게한다"라고 하면 길게하는 것과 굵게 하는것 두가지를 모두 충족시키는 설명이라고 생각되며 여기서 필요한 기술적 혁신은 실제로는 도수가 되지 못한 케이스를 포함시켜 전체 "파이 사이즈"를 크게하는 것이며 이는 엄밀히 롱테일을 길게/굵게 하는 것과는 구분됩니다. --Alfpooh 2008년 2월 8일 (금) 10:44 (KST)답변


"공개된 여러 문서에서 롱테일의 '머리'와 '꼬리'의 의미는 의미 전달을 용이하게 하기 위해 일반 통계학적 의미와는 약간 다르게 사용하고 있다. 일반적으로 통계에서는 분석하고자 하는 사건과 통계를 내는 사건이 동일해야하며, 통계를 통해 랭킹을 매기는 순간과 현상을 설명하는 순간이 일치해야한다. 분석하고자 하는 사건이 순이익인데 통계를 내는 사건이 베스트셀러라면 엄밀한 통계에서는 오류에 해당된다. 하지만 롱테일의 해설에서는 통념상 베스트셀러가 순이익과 유사하리라 보는 시각을 가정하고 있다. '머리'를 정하는 통계 시점과 '꼬리'를 정하는 통계 시점이 시간적 불일치하에 설명되기도 한다. '머리'를 정하는 시점은 오프라인등과 같은 기존 방식의 시스템하에서이며 '꼬리'를 정하는 시점은 온라인등과 같은 새로운 방식의 시스템 하에서라 가정하는 경우가 이에 해당한다. 이는 실생활의 문제가 다양하며 롱테일의 적용범위가 넓음에 기인하며, '머리'와 '꼬리'를 엄밀한 통계학적 의미로 적용해도 롱테일을 설명할 수 있다"

특히 엄밀한 통계라는 부분에서 오류라 함은 샘플링 방법이 부적절하다고 생각하시는 부분 같은데 통계적으로 유의미한 검정력을 가지고 있는지는 실제 샘플링과 이의 검정을 통하여 결정되어야 한다고 생각됩니다. 설사 시간적 불일치 하더라도 유의미한 통계는 가능하며 어떤 제품이 '머리'에 해당하는지 '꼬리'에 해당하는 지는 어떤 시점에서 누적된 데이터를 기준으로 하는 경우가 많습니다. 이런 누적 데이타가 없는 경우는 제품이 대상으로 하는 시장 규모와 역사적(경험적) 자료로 결정되는 것이 실무적인 해결 방안입니다. 단 "롱테일 현상"의 경우에는 기술적 발달과 혁신에 의해 이러한 제한을 극복할 수 있다는 점이 기존의 고정관념을 깨는 부분입니다. 그렇지 못하다면 전략적으로 '머리'에 집중하고 '꼬리'를 짤라버리는 것이 효과적인 경영방법이라는 것이 일반적인 경제논리입니다. --Alfpooh 2008년 2월 8일 (금) 02:05 (KST)답변
엄밀한이라고 한 것은 사실상 대부분의 경우에는 맞지만 수학적으로 정확하게 표현 하기가 어렵다는 의미였습니다. 예를들면 베스트셀러와 순이익의 상관도등과 같은 복잡한 좀 더 긴 수학을 동원하면 롱테일을 좀 더 엄밀하게 설명할 수 있을 것 같긴한데 말씀하신데로 기술의 발달로 테일의 중요도가 높아지고 있다를 설명하는데는 사족일 것 같다는게 의견이었습니다. 엄밀한은 사실상이라는 말들로 다시 표현될 필요가 있어 보이긴 합니다. 워낙 새로운 분야고 논문이 아닌 한 사람의 기사를 주로 백과 사전화하고 있어 쉬운일이 아니라 생각됩니다. 영문/일문 위키백과가 하고 있듯이 그룹 지성 많이 이런 어려움을 극복할 수 있으리라 봅니다. Jamessungjin.kim 2008년 2월 8일 (금) 10:21 (KST)답변
솔직히 말씀드리면 ^ ^;;; 베스트셀러와 순이익의 상관도는 현실적으로 오히려 낮을수 있다는 것이 현실적입니다. 너무도 예외 상황이 많기 때문입니다. 예를들어 마켓에서의 시장점유율 확보를 위해 싸게 내놓는 제품의 경우 물량은 많으나 순이익을 작거나 심지어는 손해를 보고 파는 경우도 있습니다. 그것은 실제 비즈니스에서는 전체적 매출에 의한 전체적 이익을 보는 "전쟁"에서 이기는 전략을 구사하기 때문입니다. 또한 이것은 일시적으로 이용하기도 하는데 경쟁자를 몰아내기 위한 힘싸움이고 '총알'이 많은 쪽이 이길수 있기 대문입니다. 따라서 베스트셀러와 순이익이 항상 양의 상관을 가진다는 것은...ㅎㅎㅎ 진실이 아닙니다. ^ ^;--Alfpooh 2008년 2월 8일 (금) 10:49 (KST)답변
저도 100% 공감하는 내용입니다. 일전에 파레토 원리를 배울때 그 차이를 알게 되었습니다. 파레토나 롱테일이나 중요한 것은 어느 것을 기준으로 보느냐가 아닐까요? 예를들어 대학에서 입학한 학생의 수가 중요할때가 있을 것이고 입학한 학생의 능력이 중요할때가 또 있을 것입니다. 매출이든 순이익이든지 파레토나 롱테일의 원리를 설명하는데 어려울 것은 없어 보이는데 어떻게 생각하시는지요? Jamessungjin.kim 2008년 2월 8일 (금) 23:28 (KST)답변
말씀드렸듯 수학적 모델에서는 순이익이나 매출을 연결시켜 설명하는 것이 대단히 곤란합니다. 다만 이것이 판매량의 통계적 모습일때 파레토 법칙의 가정을 이용하는 것이 가능할 수 있을 것입니다. 순이익이나 매출에 연결하고자 하면 단가가 일정해야 겠지요. 하지만 예에서 빈번히 사용한 교보문고의 경우 아시다시피 다양한 베스트 셀러의 가격은 서로 다양합니다. 이럴 경우 A의 판매량이 많다고 해서 B의 매출액과 비교하는 것은 적절치 않습니다. 당연히 한 제품의 순이익 구조는..며느리도 모르는 부분이니..ㅎㅎㅎ 하옇든 수학적 설명에서는 적절치 않습니다. --Alfpooh 2008년 2월 9일 (토) 01:56 (KST)답변
공정능력지수를 참조하시길 권해드립니다. 군내변동과 군간변동을 고려하여 통계적 프로세스의 신뢰성을 확보하는 것에 관한 것입니다. 이러한 통계적 방법 검증을 통해 "엄밀한 통계" 사실은 "특정범위내에서 신뢰가능한 통계"가 가능해 집니다. --Alfpooh 2008년 2월 8일 (금) 03:42 (KST)답변

수학적 설명의 그래프

수학적 설명에서 현재 삽입된 그래프는 수학적 모델로 설명되지 않는 그래프입니다. 다른 시장,경제적 관점으로 볼때 의미 있을지 모르나 수학적 설명에는 어울리지 않습니다. 일단 본문에서는 빼도록 하겠습니다. 다만 위에 원래 달려있는 그래프도 썩 그리 좋은 품질은 아닌듯 합니다. 좀 더 좋은 품질의 롱테일 그래프가 있으면 합니다.--Alfpooh 2008년 2월 8일 (금) 17:47 (KST)답변

저도 그런 생각을 하긴 했습니다. 그래프에 대한 설명이 좀 더 필요하다고 생각되었습니다. 일단 그림을 두고 다른 분들의 의견을 듣다가 새로운 그림이 나오면 변경하는 건 어떨까요? 그래프가 없어지면 그래프에 대한 다른 분들의 의견을 듣기가 힘들 것 같거든요. 지금의 그래프처럼 라인 하나를 두고 설명하는 것은 롱테일 설명에 부족한 것 같아 두 라인으로 바꾼 것입니다. 일단 제가 그림은 원상 복귀를 해 보았습니다. 영문 위키 백과의 The long tail을 참조 바랍니다. 지식 사회로 가기 위한 중요한 개념인 롱테일에 많은 신경을 쓰주셔서 감사합니다. 최근 (07년 10월) 앤드슨이 밝힌 프리코노믹스 용어도 함께 정리할 필요가 있다고 생각됩니다. Alfpooh님 의견은 어떠신지요? Jamessungjin.kim 2008년 2월 8일 (금) 23:19 (KST)답변
사실 집단지성쪽에 관심이 있습니다만... 그래프에 관련해서는 위쪽 아래쪽 모두 별로 마음에 들지 않습니다. 도움이 안되고 헷갈리게만 만들지 않을까 걱정됩니다. 정확하지 않은 정보는...솔직히 말씀드려 빼는 것이 낫다고 생각합니다. --Alfpooh 2008년 2월 9일 (토) 01:49 (KST)답변
"긴 꼬리/보존 1" 문서로 돌아갑니다.