基于长尾理论的拼多多下沉市场战略分析外文翻译资料

 2023-03-17 03:03

基于长尾理论的拼多多下沉市场战略分析

摘要:随着互联网时代的到来,长尾理论应运而生。国外学者对于长尾理论在各领域的应用都做出了相关分析。MariaDrsquo; Alessio发现许多社会现象和消费者的选择都具有长尾分布的特征,调查了4 ~ 8岁儿童在电视节目领域的偏好,发现儿童的偏好具有长尾分布特征。Philip G Brabazon通过研究传统汽车经销商销售,以此论证长尾效应。Trevor Fenner则研究长尾理论在网络销售中的应用,借助网上读书销售分析。以上国外学者对于长尾理论的应用研究都具有重要意义,为笔者撰写长尾理论相关论文提供了思路。

关键词:长尾理论;消费者偏好;网络销售;汽车销售

文献一:

预测图书销售的长尾:挖掘幂律指数

原文作者:Trevor Fenner, Mark Levenelowast;, George Loizou

单位:英国伦敦大学伯克贝克分校计算机科学与信息系统系,伦敦WC1E 7HX

摘要:长尾的概念最近被用来解释电子商务中的一种现象,即处于长尾的商品的总销售额与最受欢迎的商品的总销售额相当。以在线图书销售为例,在数据服从幂律分布的前提下,利用回归技术估计了尾部销售的比例。在这里,我们提出了一种不同的估计技术,基于生成模型的图书销售,导致销售的渐近幂律分布,但不遭受幂律回归技术相关的问题。我们证明了预测的尾部销售比例对估计的幂律指数非常敏感。特别是,如果我们假设累积分布的幂律指数接近1.1,而不是1.2(估计在2003年出版,由两组研究人员使用回归计算),然后,我们的计算表明,尾巴Amazon.com的销售,而不是40%,估计布胡士泰和史密斯在2003年的调查中所占比例实际上接近20%,这是该公司首席执行官估计的比例。

关键词:长尾;幂律分布;随机模型

1.介绍

长尾现象是一种允许电子商务企业从大量不太受欢迎的商品的小销售量中获得巨大利润的现象。众所周知,许多提供书籍、音乐和电影等产品的在线零售商的总销售额与最受欢迎的产品(即“大片”)的销售额相当。在假设数据服从幂律分布的情况下,可使用回归技术估计滞销比例。纽曼在参考文献[1]中提供了证据,证明图书销售确实遵循幂律。在本文中,我们提出了一种基于模拟简化销售过程的生成模型的不同的估计尾销的方法,并得到了渐近幂律分布。我们的生成模型还有一个优势,即可以通过已知的可用产品数量和总销售额来估计尾销的比例。我们介绍的方法可能有助于为电子商务业务提供销售分析,以预测和验证尾部销售额。采用数学形式的幂律分布:

其中C和tau;为正常数,表示具有值i的观测值的比例。常数tau;称为分布的指数[1]。有许多众所周知的权力分配的例子[2];例如,洛特卡定律指出,发表规定数量论文的作者数量与发表数量的平方成反比。帕累托定律是(1)的一个累积版本,它指出个人收入高于某一水平的人数遵循指数在1.5到2之间的幂律。齐普夫定律指出,文本中单词的相对频率与其排名成反比,它是频率高于某一水平的单词比例的累积幂律分布的倒数。(我们注意到,对于tau;gt;1,与分布(1)对应的累积分布,即大于i的观测比例,也遵循幂律,但具有指数tau;minus; 1.其逆函数是频率对秩的齐普夫分布,也遵循幂律,现在指数为1/(tau;)minus; 1).)

产品类别

在线零售

实体零售

2300000

40000-100000

CD

250000

5000-15000

DVD

18000

500-1500

数码相机

213

36

便携式MP3播放器

128

16

平板扫描仪

171

13

表1大型在线零售商和实体零售商的产品品种比较

幂律分布的尾部以多项式形式衰减,与正态分布和几何分布的指数衰减特性相反。众所周知,幂律分布很难拟合[3],幂律标度中通常存在指数截止,尽管这种截止只能在超大数据集的分布尾部观察到[4]。指数截止的幂律分布[5]是数学形式:

其中0lt;qlt;1,且通常为qasymp; 1.

“长尾”的概念最近被安德森(Anderson)[6]推广(另见www.longtail.com)目前,它被用来解释电子商务中的一种现象,即Zipfan系列中商品的总销量与salesrank的销量分布相当于最受欢迎的商品的销量。应用长尾分析的一个销售类别是在线图书销售。在参考文献中。[7,8]有人认为,在线书店产品种类的大幅增加对消费者福利有着显著的积极影响。他们的分析也适用于CD和DVD等电子产品。表1取自REF。[7] ,显示了网上和实体店提供的产品数量。参考文献[9]对网上图书销售数据进行了分析,以比较Namazon.com和BarnesandNoble.com之间的需求和价格竞争。为了分析长尾效应,需要估计书的销售排名与销售量之间的假定累积幂律分布指数。

在参考文献[9]中,tau;的估计minus;1使用的是1.2,而在参考文献[7]中使用的是略低的值1.1481。(一本书的销售排名比售出更多本的书的数量高一个。)根据幂律指数的后一个估计,并假设,如表1所示,最受欢迎的10万本书都存放在实体店,Brynjolfsson等人[7]得出的结论是,亚马逊网站约40%的销售额是由通常在这些商店中找不到的商品所代表的。有趣的是,亚马逊网站首席执行官杰夫·贝佐斯(Jeff Bezos)认为40%的数字太高了,而实际数字接近20%[10]。那么,假设贝佐斯是正确的,我们如何解释这种差异呢?

亚马逊网站销售数据的幂律指数估计存在一些不一致性,不同的搜索者报告了tau;的值minus;1在略低于1.0到大约1.3[7,9]的范围内。这并不奇怪,因为在幂律分布[3,4]中存在固有的困难,而且通常不清楚该分布是否确实是一个纯幂律。我们将证明我们在下一节中描述的生成模型支持指数tau;minus; 1假设杰夫·贝佐斯(Jeff Bezos)估计的20%的销量比40%的销量更接近现实,亚马逊网站的销售数据为1.1。

最近的一种方法在一定程度上绕过了上述问题,即假设一个生成模型,该模型产生的分布是渐近的纯幂律分布或幂律分布,其中q(2)接近1.0[1]。(与纯幂律相比,后者涵盖了更广泛的现实场景。)第2节给出了此类模型的详细信息。我们使用该模型调查幂律指数的可能性,幂律指数与表1中给出的图书数据一致,对应于20%、30%或40%的销售额处于分布的尾部。第3节介绍了我们使用的方法和我们的结果,以及来自REF的天冬氨酸数据集分析。[6] 最后,在第5节中,我们给出了我们的结论。

2.具有指数截断的幂律随机模型

参考文献[5]中提出的随机模型可以在产品销售和特定书籍中描述,如下所示。我们有无数的骨灰盒,比如骨灰盒(i),i=1,2,其中,每个瓮中都包含一定数量的产品,例如书籍或CD。如果产品在进入系统后已售出其副本,则该产品在urn(i)中。最初,所有的骨灰盒都是空的,除了骨灰盒(1),里面有一个产品(其中一个已经售出)。在时间t 1时,发生以下两种情况之一:

(a) 概率为p,0lt;plt;1时,新产品插入到urn(1)(这代表该产品的首次销售),或

(b) 概率为1minus; p、 选择一种产品的概率与该产品截至时间t的销售数量成比例,即与urn(1)中的产品的i成比例(因此,选择遵循优先附加规则[11]。最初在参考文献[12,13]中建议);然后:

(i) 概率为q时,0lt;qle; 1,所选产品从urn(i)转移到urn(i 1)-这表示所选产品的附加副本,或

(ii)概率为1minus; q、 所选产品从urn(i)中丢弃-这表示所选产品正在停止,例如,如果一本书已经绝版;当q=1时,“旧”产品始终可用。

为了简单起见,我们假设了模型的上述初始条件。然而,可以看出,任何其他初始条件都会导致下面描述的相同渐近分布。

对于以下分析,我们将从现在起假设q=1,因为对于此处考虑的Amazon.com销售数据,研究人员[7,9]假设为纯幂律分布(即q=1)。从网络的角度来看,这样的假设并不是不合理的,因为印刷书籍的第二份讲义通常可以在网上获得,而且向按需模式发展的趋势正在增加不太受欢迎书籍的可用性。然而,如果在线销售数据集可用,可以测试在实践中是否存在明显的幂律分布中断。

设g(i)为urn(i)中乘积的渐近比例。它显示在ref中。[12] (参见参考文献[5])对于igt;1,

对于i=1,

这里,

Gamma;是伽马函数[14]。它还表明:

这与p是该产品第一次销售的销售比例,即销售的产品数量与总销售数量的比率这一事实是一致的。使用斯特林近似[14],从(3)可以看出,对于大i,对应于(1),我们得到:

这里平均值渐近于,且C=(tau;minus; 1)Gamma; (tau; ). (我们在参考文献[5]中已经证明,当qlt;1时,g(i)渐近于(2)中给出的更一般形式。)我们注意到,对于任何给定的指数tau;,g(i)的值都将小于上述渐近近似值。此外,对于i的较小值,差异将更大,这与尾部销售额相对应,我们将在下一节中看到。

3.尾巴有多长?

从现在起,我们将假设我们是在与书籍打交道。我们将长尾定义为包含那些在线可用但在实体书店中不可用的书名。为了找出长尾中的销售额比例,从表1中获取数据,我们假设2300000是alpha;的估计值,alpha;是印刷品的总数量,因此是在线可能获得的书名数量;我们还假设beta;,一家非常大的实体书店中储存的书名数量大约为100000。

设N为砖混商店中储存的任何标题的在线商店出售的最小副本数。为了找到尾销的比例,我们首先需要找到N,即最小的整数:

其中,右侧表示发行版长尾中的标题数量。我们注意到,对于上一节的随机模型,当jgt;i时,urn(j)中的标题比urn(i)中的标题更受欢迎,因为它们有更多的副本。因此,在(6)中,我们将g(i)与urn(i)中标题的比例相加,从1到N,以便找到尾部标题数量的界限。

表2 各种累积幂律指数的尾部销售比例

表3 2004年的图书销售数据[6]

现在让delta;为urn(N)中尾部的标题数,所以:

销售在长尾中的比例lambda;由下式给出:

由于urn(i)中标题对应的销售额比例为ig(i)p乘以(5)。

给定alpha;和beta;,我们得到幂律指数tau;的估计值,该指数对应于以下给定的lambda;值。对于tau;wep的合适范围,从(4)计算p,从(3)计算g(i)。然后使用不等式(6)获得N,即尾部的阈值体积。最后,根据(7)和(8)计算lambda;。然后,我们可以选择与给定的lambda;值最接近的tau;值。此外,如果我们知道每个标题的平均销售份数,即(5)是我们的模型的1/pin,tau;可以从(4)中计算出来,然后lambda;的相应值可以如上所述计算出来。

Brynjolfsson等人[7]使用幂律指数对tau;的累积分布进行了估算,得出了40%的尾部销售额minus; 1=1.1481,0.871的倒数,通过拟合Zipfian分布[1]得出的指数,将销售量与销售排名联系起来。(之前从2002年开始的估算仅依赖于2个点而非800个点,得出的指数为1.0917,倒数为0.916;参见参考文献[7])。然而,参考文献[9]中使用的估算指数是较高的1.2。

表2显示了若干tau;值的lambda;值minus; 1,如上所述计算。可以看出,估计的尾部销售比例对幂律指数非常敏感。特别是,如果累积分布的幂律指数接近1.1,参考文献[7]中的早期估计值,而不是1.2[9],那么使用我们的模型得出的结果表明,亚马逊网站的尾部销售额实际上将接近20%。该数字与首席执行官报告的估计值一致,而不是参考文献[7]中估计的40%;如果指数接近1.15(参考文献[7]中最近的估计),我们的结果表明,尾部的销售额比例将接近30%。

对我们结果的解释不是文献[7]中用于估计幂律指数的方法比文献[9]中使用的方法更准确,反之亦然,而是对拟合幂律分布的一般性批评。生成模型,如第2节中介绍的随机urn模型,可用于验证幂律统计数据,特别是如果有其他信息可用,如杰夫·贝佐斯(Jeff Bezos)在本例中的估计。

4.对尾部销售比例的进一步分析

我们现在尝试使用Anderson[6,第121页]提供的图书销售数据来验证上述结果,他用该数据来支持他的论点,即销售数据遵循幂律分布,或者用他的术语来说,是“长尾”的。(这是我们能够获得的唯一图书销售数据集——图书销售商很不愿意提供他们的销售数据,可能是出于商业原因。)在表3中,我们重现了这一稀疏的数据集。“范围”是指每本书的销售数量的范围,“书籍”是指在该范围内销售的不同书名的数量,“单位”是指在该范围内销

剩余内容已隐藏,支付完成后下载完整资料


基于长尾理论的拼多多下沉市场战略分析

文献原文一:

Predicting the long tail of book sales: Unearthing the power-law exponent

1. Introduction

The long tail is the phenomenon that allows an e-commerce business to make significant profit from small sales volumes of a large number of less popular items. It is well known that in aggregate the tail sales of many online retailers, offering products such as books, music and films, are comparable to the sales of the most popular items, i.e. the lsquo;lsquo;blockbustersrsquo;rsquo;. The proportion of tail sales may be estimated using regression techniques on the assumption that the data obeys a power-law distribution. Newman, in Ref. [1], provides evidence that books sales do indeed follow a power law. In this paper we present a different method for estimating the tail sales based on a generative model that simulates a simplified sales process, and results in an asymptotic power-law distribution. Our generative model also has the advantage that the proportion of tail sales can be estimated from the number of available products and the total volume of sales, when these are known. The methodology we present may be useful in providing sales analytics for an e-commerce business in relation to prediction and validation of sales volumes from the tail.

A power-law distribution taking the mathematical form

where C and tau; are positive constants, represents the proportion of observations having the value i. The constant tau; is called the exponent of the distribution [1]. There are many well-known examples of power-law distributions [2]; for example, Lotkarsquo;s law states that the number of authors publishing a prescribed number of papers is inversely proportional to the square of the number of publications. Paretorsquo;s law, which is a cumulative version of (1), states that the number of people whose personal income is above a certain level follows a power law with an exponent between 1.5 and 2. Zipfrsquo;s law, which states that the relative frequency of a word in a text is inversely proportional to its rank, is the inverse of the cumulative power-law distribution for the proportion of words whose frequency is above a certain level. (We note that for tau; gt; 1 the cumulative distribution corresponding to the distribution (1), i.e. the proportion of observations greater than i, also follows a power law, but with exponent tau; minus; 1. Its inverse is a Zipfian distribution of frequency against rank, which also follows a power law, now with exponent 1/(tau; minus; 1).)

Table 1 Product variety comparison for large Online and Brick-and-mortar retailers

The tail of a power-law distribution decays polynomially, in contrast to the exponential decay characteristic of distributions such as the Normal and geometric. Power-law distributions are notoriously hard to fit [3], and often there is an exponential cutoff present in the power-law scaling, although this cutoff may only be observable in the tail of the distribution for extremely large data sets [4]. A power-law distribution with exponential cutoff [5] is of the mathematical form

where 0 lt; q lt; 1, and frequently q asymp; 1. The concept of the long tail has been recently popularised by Anderson [6] (see also www.longtail.com) and is currently used to explain the phenomenon in e-commerce where the total volume of sales of the items in the tail of a Zipfian distribution of sales volume against sales rank is comparable to that of the most popular items. One category of sales to which long tail analysis has been applied is online book sales. In Refs. [7,8] it was argued that the considerable increase of product variety in online book stores has a significant positive impact on consumer welfare. Their analysis also applies to other products such as CDs and DVDs. Table 1, taken from Ref. [7], shows the numbers of products available from Online and Brick-and-mortar stores.

In Ref. [9] an analysis of online book sales data was carried out to compare the demand and price competition between Amazon.com and BarnesandNoble.com. In order to analyse the long tail, the exponent of the assumed cumulative power-law distribution relating the sales rank of a book to the number of copies sold needs to be estimated. In Ref. [9] the estimate of tau; minus;1 used was 1.2, while in Ref. [7] the slightly lower value of 1.1481 was used. (The sales rank of a book is one greater than the number of books that have sold more copies.) Based on the latter estimate of the power-law exponent and assuming, as shown in Table 1, that the most popular 100,000 titles are stocked in Brick-and-mortar stores, Brynjolfsson et al. [7] concluded that about 40% of Amazon.comrsquo;s sales are represented by titles that would not normally be found in these stores. It is interesting to note that Jeff Bezos, the CEO of Amazon.com, thought that the 40% figure was too high and the real figure was closer to 20% [10]. So, assuming that Bezos is correct, how can we explain this discrepancy?

There is some inconsistency in the estimation of the power-law exponent for Amazon.comrsquo;s sales data, and different researchers have reported values for tau; minus;1 in the range from just below 1.0 to approximately 1.3 [7,9]. This is not surprising, since there are inherent difficulties in fitting power-law distributions [3,4] and it is often unclear whether or not the distribution is indeed a pure power law. We will show that the generative model we describe in the next section supports the exponent tau; minus; 1 being in the region of 1.1 for Amazon.comrsquo;s sales data, assuming that Jeff Bezosrsquo;s estimate of 20% tail sales is closer to reality than 40%.

A recent approach, which to a certain extent circumvents the above problems, is to assume a generative model that results in a distribution that is asymptotically either a pure power-law distribution or a power-law distribution with exponential cutof

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[595234],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。