2022年期末考试复习总结

期末考试复习总结

第一章

1、结合实际案例,分析电子商务的概念与特点

案例:网上书店、超市、

概念:电子商务是指通过互联网进行销售商品、提供服务等的商务活动

特点:

  1. 普遍性:是现代经济发展型社会的主角

  2. 方便性

  3. 虚拟性:在虚拟环境中进行

  4. 商务性:提供买卖交易的服务、手段和机会

  5. 低成本:无店面、无专门的销售人员、无库存压力、行销成本低

  6. 电子化:无纸贸易

  7. 服务性:突破了时空限制,以服务为中心的商务活动

  8. 集成性:事务处理的整体性和统一性

  9. 可拓展性

  10. 安全性

  11. 协调性:多行业各部门通力合作

image-20230213173003543

2、电子商务系统的各个组成部分及分工

电子商务系统是指商务活动的各方,包括企业和商家、工商管理等行政部门、客户、银行等金融机构,利用计算机通信网络等技术实现商务活动的信息系统。

image-20230213171928516

组成部分:

  1. 基础设备

    • 电子商务赖以运行的网络服务平台,支撑着商务活动的全过程。
      • 一般有因特网、企业内部网、企业外联网等。
  2. 电子支付环境

    • 电子支付是电子商务活动的关键环节和重要组成部分,是电子商务能够顺利发展的基础条件。
  3. 信用环境

    • 建立和完善电子商务认证中心。认证中心是改善电子商务信用环境必要保障。
    • 制定相关法律和制度,保障正常的电子商务活动的进行。
    • 建立社会信用评价制度和体系,为电子商务交易提供资信服务。
  4. 物流环境

    • 物流是指物质实体从供应者向需求者的物理移动,包括运输、保管、配送、包装、装卸、流通、加工及物流信息处理等多项基本活动,是这些活动的统一。

image-20230213172049808

  • 市场:寻找和保持客户/优化产品/客户管理;

  • 销售:为客户提供可组合的、灵活的购买计划,提供方便易用的产品搜索/销

  • 售分析;

  • 采购:联机采购在线报价/电子支付;

  • 配送/后勤:交付的可视化/订单可跟踪;

  • 客户服务:新的客户服务,每周7天、每天24小时服务,服务的及时反馈,一对一个性化服务和自助式服务/服务过程记录。

3、电子商务的分类
  1. 按商业活动运作方式分类

    1. 完全电子商务
    2. 不完全电子商务
  2. 按交易对象分类

    1. 企业对消费者的电子商务(B to C)
    2. 企业对企业的电子商务(B to B)
    3. 消费者对消费者的电子商务(C to C)
    4. 消费者对企业的电子商务(C to B)
    5. 线上到线下的电子商务(O to O)
    6. 面向市场营销的电子商务(B to M)
    7. 生产厂家直接对消费者的电子商务(M to C)
  3. 按电子交易的网络平台分类

    1. 基于Intranet的电子商务
    2. 基于Extranet的电子商务
    3. 基于Internet的电子商务
    4. 基于其他网络的电子商务
  4. 按开展电子商务的信息网络范围分类

    1. 本地电子商务
    2. 远程电子商务
    3. 全球电子商务
  5. 按商务与电子的融合程度分类

    1. 初级层次
    2. 中级层次
    3. 高级层次

第二章

1、结合案例分析,理解电子商务模式
  1. B2C(Business to Customer)模式

    • 关键:企业与消费者
    • 交易过程:
      • 购买前的准备
      • 购买过程
      • 售后服务
    • B2C模式是我国最早产生的电子商务模式,以8848网上商城正式运营为标志。
    • 问题❓:小红书是C2B-B2C
      • (待定)小红书的电商模式有哪些特点:
        • 社区+电商
  2. C2C( Customer to Customer)模式

    • 关键:消费者与消费者
    • 典型例子:淘宝网、拍拍网……
    • 特点:
      • 用户数量多,身份复杂;
      • 商品信息多,商品质量参差不齐;
      • 交易次数多,但每次交易成交额较小;
      • 柔性价格机制;
      • 为买卖双方交易提供系列配套服务。
  3. C2B( Customer to Business )模式

    • 关键:消费者与企业
    • 典型例子:中国团购在线、一起买……
    • 特点:
      • 买方议价能力增强;
      • 降低买卖双方的交易成本和时间;
      • 降低了交易的不确定性;
      • 利于消费者维权与厂商售后服务;
      • 有利于商品信息资源的开发与利用。
    • 问题❓:
      • 拼多多是C2B模式吗?✔️
      • 美团是C2B模式吗?✔️
  4. B2B( Business to Business )模式

    • 关键:企业与企业
    • 典型例子:阿里巴巴、百纳网、中国网库、中国制造网、敦煌网、慧聪网、瀛商网等
    • 按行业性质可分为综合B2B和垂直B2B。
    • B2B模式分类:
      • 内部网模式
      • 企业与外部企业间的模式
      • 中介模式
  5. O2O( Online to Offline )模式

    • 关键:线上到线下
    • 消费者通过线上筛选商品,线下体验服务,成交可以在线上进行支付
    • 特点:
      • 线上引导,线下消费
      • 推广效果可查,每笔交易可跟踪
        • 更省钱
        • 更高效
        • 更合理
        • 更便捷
    • 问题❓:设计一个餐馆座位预约的O2O应用方案
  6. 二维码电子商务模式

    • 关键:二维码-云服务-移动支付
    • 二维码功能:
      • 信息获取(名片、地图、WIFI 密码、资料)
      • 网站跳转(跳转到微博、手机网站、网站)
      • 广告推送(用户扫码,直接浏览商家推送的视频、音频广告)
      • 手机电商(用户扫码、手机直接购物下单)
      • 防伪溯源(用户扫码、即可查看生产地;同时后台可以获取最终消费地􀀀
      • 优惠促销(用户扫码,下载电子优惠券,抽奖)
      • 会员管理(用户手机上获取电子会员信息、VIP 服务)􀀀
      • 手机支付(扫描商品二维码,通过银行/第三方支付提供的手机端通道完成支付)
    • 二维码按原理分类:
      • 堆叠式/行排式二维条码,又称堆积式
      • 矩阵式二维码
  7. 电子商务商业模式

    • 关键:

第三章

1、万维网的基本概念和工作流程。
  1. 基本概念:万维网WWW(World Wide Web)是环球信息网的缩写,也写作“Web”、“3W”等。

  2. 工作流程:

    1. 万维网以客户/服务器方式工作。
    2. 浏览器就是在用户计算机上的万维网客户程序。万维网文档所驻留的计算机则运行服务器程序,因此这个计算机也称为万维网服务器。
    3. 客户程序向服务器程序发出请求,服务器程序向客户程序送回客户所要的万维网文档。
    4. 在一个客户程序主窗口上显示出的万维网文档称为页面(page)。

    image-20230213175910391

2、域名规则和域名分类。
  1. 域名规则:

    1. 英文命名规则:
      • 域名中包含以下字符:
        • 26个英文字母
        • 0-9十个数字
        • “-”英文中的连字符
      • 域名中字符的组合规则:
        • 在域名中,不区分英文字母的大小写
        • 域名长度有一定限制
    2. 中文命名规则:
      • 域名中包含以下字符:
        • 至少包含1个汉字
        • 其余部分可包含26个英文字母
        • 0-9十个数字
        • “-”英文中的连字符
      • 域名中字符的组合规则:
        • 简繁体只需一个
        • 开头结尾不能有非法字符,例如,连接符、加号、@、&、空格等
        • 域名不能是纯英文或数字
        • 域名长度转换成Punycode后不超过63个字符
        • 部分域名不支持中文前缀,例如“.com.cn”、“.net.cn”、“.org.cn”等
  2. 域名分类:

    1. 从地域范围分类:国际域名和国家域名
    2. 从域名的级别进行分类:
      • 顶级域名
      • 二级域名
        • 我国二级域名又分为类别域名和行政区域名两类
3、(网络空间)虚拟主机和双线接入的概念和特点。
  1. (网络空间)虚拟主机:

    1. 概念:网站空间(Web Host),又称为虚拟主机空间或虚拟主机,指存放网站内容的空间
    2. 特点:
      • 大幅降低费用(购买服务器、租用专线、维护费用等)
      • 性能相对较好(合租服务器)
      • 无需专门的维护和管理人员
  2. (全网路由)双线接入:

    1. 概念:是指服务器所在的数据中心机房同时拥有网通与电信等多种网络出口,在机房的上层交换机上设置了全网路由技术,使服务器每次向外部网络连接时可以自动被分配到最快速的链路上。从而实现了电信与网通用户都可以同时高速访问。
    2. 特点:
    3. image-20230213180912744
4、常见的主机服务的特点。
  1. 虚拟主机

  2. 独立主机

  3. 主机托管

    • 用户自备服务器硬件,自己安装软件或付费委托服务商安装,将自己的服务器委托在服务商处保管和维护。
5、不同类型服务器的特点。
  1. 文件服务器(File Server)

  2. 数据库服务器(Database Server)

  3. 应用程序服务器(Application Server)

服务器分类——按机箱结构划分:

  1. 塔式服务器

    • 优点:
      • 单个成本较低
      • 由于机箱较大,具备良好的扩展能力和散热能力
      • 可以配置多路处理器、多根内存、多块硬盘、多个冗余电源和散热风扇
  2. 机架式服务器

    • 优点:
      • 相对塔式服务器,大大节省了空间占用,使布线、管理更为简洁
      • 节省了机房的托管费用
      • 随着技术的发展,有着不逊色于塔式服务器的性能
      • 平衡了性能和空间
    • 缺点:
      • 由于机身的限制,在扩展能力和散热能力上不如塔式服务器
      • 对制冷要求较高
      • 需要对机架式服务器的体系结构专门进行设计,如主板、接口、散热系统等,设计成本较高,价格一般也高于塔式服务器
  3. 刀片服务器

    • 优点:
      • 扩展方便,支持热插拔
      • 通过刀片架组成服务器集群,提供高速的网络服务
      • 每个刀片不需要独立的电源、显示器、制冷装置,降低功耗,减少整体成本
    • 缺点:
      • 刀片机箱的成本昂贵
      • 刀片技术更新变化频繁
      • 各大厂商锁定各自技术、没有形成统一的标准

第四章

1、理解电子商务的各种基础理论。
  1. 网络经济的基础理论

    1. 梅特卡夫定理
    2. 摩尔定律
    3. 吉尔德定律
    4. 非摩擦经济效应
    5. 网络外部性
    6. 双螺旋理论
    7. 锁定效应
    8. 维达多定律
  2. 电子商务中的基础理论

    1. 长尾理论
    2. 注意力经济
    3. 维基经济学
    4. 威克理论

第五章

1、理解竞争性和互补相关性的概念。
  1. 竞争性(替代性):不同产品在具体的有用性质(功能)上互相代替的属性。

  2. 互补相关性:

2、熟悉Compkey方法。
  • Step1:通过对查询日志的搜索,提取出所有与种子关键词𝑠 同时出现的中介关键词𝑎;

  • Step2:计算出所有包含𝑠 与𝑠𝑎的查询搜索量;

  • Step3:计算所有中介关键词权重;

  • Step4:对查询日志进行搜索以确定不同时与𝑠出现,但与某一中介关键词同时出现的竞争性关键词集合,然后计算每个关键词的竞争度。

  • Step5: 对所有计算得到的竞争性关键字按照竞争度大小进行降序排列。

image-20230213210934536

  • ❓问题:该方法的时间复杂度和空间复杂度是多少?

第七章

1、理解搜索引擎分类及其原理。

搜索引擎分类:

  1. 全文搜索引擎:

    • 原理:全文搜索引擎是从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
    • 典型例子:百度、谷歌Google
    • 特点:搜全率比较高
  2. 目录搜索引擎:

    • 原理:将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。
    • 典型例子:
    • 特点:查找的准确率比较高
  3. 元搜索引擎:

    • 原理:元搜索引擎(Meta Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。
    • 典型例子:360搜索、InfoSpace、Dogpile、Vivisimo等
    • 特点:
  4. 垂直搜索引擎:

    • 原理:不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。
    • 典型例子:
    • 特点:垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样
2、理解搜索引擎的各组成部分。

搜索引擎的各组成部分:

  1. 搜索器:其功能是在互联网中漫游,发现和搜集信息

  2. 索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表

  3. 检索器:其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息

  4. 用户接口(HTML页面):其作用是接纳用户查询、显示查询结果、提供个性化查询项

image-20230213212208109

3、理解网络蜘蛛的基本原理。

1️⃣网络蜘蛛的基本原理:

  1. 网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。

  2. 蜘蛛是一种半自动的程序,就象现实当中的蜘蛛在它的Web(蜘蛛网)上旅行一样,蜘蛛程序也按照类似的方式在Web链接织成的网上旅行。

  3. 它总是需要一个初始链接(出发点),但此后的运行情况就要由它自己决定了,蜘蛛程序会扫描起始页面包含的链接,然后访问这些链接指向的页面,再分析和追踪那些页面包含的链接。

  4. 从理论上看,最终蜘蛛程序会访问到Internet上的几乎每一个页面,因为Internet上几乎每一个页面总是被其他或多或少的页面引用。

2️⃣在抓取网页的时候,网络蜘蛛一般有两种策略:

  • 广度优先:

    • 广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。
    • 优点:可以让网络蜘蛛并行处理,提高其抓取速度
  • 深度优先:

    • 深度优先是指网络蜘蛛会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。
    • 优点:设计时比较容易
4、理解不同类型分词方法及其难点。
  1. 基于词典的分词方法

    • 按照一定策略将待分析的汉字串与一个词典中的词条进行匹配,若在词典中找到该字符串,则匹配成功。
    • 最大匹配法(Maximum Matching, MM)——有词典切分、机械切分
      • 正向最大匹配算法(Forward MM, FMM)
      • 逆向最大匹配算法(Reverse MM, RMM)
      • 双向最大匹配算法(Bi-directional, BMM)
  2. 基于统计的分词方法

    • 把每个词看做是由词的最小单位各个字总成的,如果相连的字在不同的文本中出现的次数越多,就证明这相连的字很可能就是一个词。
    • 可以利用字与字相邻出现的频率来反应成词的可靠度,统计语料中相邻共现的各个字的组合的频度,当组合频度高于某一个临界值时,便可认为此字组可能会构成一个词语。
  3. 基于理解的分词方法

    • 基于理解的分词方法是通过让计算机模拟人对句子的理解,达到识别词的效果。
    • 基本思想:就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。
    • 通常包括三个部分:分词子系统、句法语义子系统、总控部分

中文分词的难点:

  1. 歧义识别

  2. 新词(未登录词)识别

5、PageRank算法。

基本思想:

  • 可度越高的网页越重要,即反向链接(入链)(backlink)越多的网页越重要

  • 反向链接的源网页质量越高,被这些高质量网页的链接指向的网页越重要

  • 链接数越少的网页越重要

算法思想:

image-20230213213920468

例子:

步骤1:

image-20230213214051007

步骤2:

image-20230213214242309

步骤3:

image-20230213214354801

Web图:

如果将一个网页抽象成一个节点,而将网页之间的链接理解为一条有向边,则可以把整个互联网抽象为一个包含页面节点和节点之间联系边的有向图,称之为Web图。

入链与出链:

  • 出链:自己网页到别的网页

  • 入链:别的网页到自己网页

  • 外链:来源于/去往别的网站的别的网页

  • 内链:来源于/去往本网站的别的网页

  • 反向链接=入链

    • A→B是A的出链, D→A是A的入链

锚文字:

所谓锚文字,就是页面内某个出链附近的一些描述文字。

课后学习:

image-20230213214439823

第八章

1、理解SEO相关术语。

SEO (Search Engine Optimization),译为搜索引擎优化

SEO相关术语:

  • PV (Page View):PV是用户访问网站时所浏览的总网页数

  • 百度快照:百度蜘蛛在爬取网页内容时,将网页文本内容独立创建一个文本文件,保存在百度数据库中的网页的“照片”。

  • SEO黑帽(SEO black hat):简单来说,SEO黑帽就是采用了搜索引擎所禁止的方法(作弊),对网站在搜索引擎的排名进行优化,在短时间内排到搜索引擎前列。

  • SEO白帽(SEO white hat):白帽所指的是采用合理的SEO行为优化网站,提高用户的体验,合理与其他网站互联,从而达到网站在搜索引擎排名的稳步提升。

  • 跳出率:是指来到网站只浏览了一个页面就离开的用户占网站总浏览用户的百分比。

  • 沙盒效应(Sandbox):指一个新建立的网站在刚上线的一个或几个月内,在搜索引擎上很难有好的排名,甚至没有排名。

  • SPAM(Specially Processed Assorted Meat): 指专门针对那些欺骗搜索引擎的技术。搜索引擎垃圾技术是利用不道德的技巧去提高自己搜索引擎上的排名

2、熟悉SEO常用的技术。
  1. 网页title的优化

  2. 关键词的选取

  3. 关键词的优化

  4. 元标签及网页描述的优化

  5. 网站结构和URL优化

  6. robots.txt文件

  7. 网页链接的优化

  8. Heading标签的优化

  9. 图片优化

  10. 网页减肥

SEO常用作弊方法:

  1. 桥页(Doorway Pages)

  2. 关键词堆砌(Keyword Stuffing)

  3. 隐藏文字(Hidden Text)

  4. 隐藏链接(Hidden Link)

  5. 隐藏页面(Cloaked Page)

3、能够编辑Robots文件。

第九章

1、熟悉关联分析方法,如Apriori。

Apriori算法

  • 第一个关联规则挖掘算法

  • 频繁项集的子集也一定是频繁的,如果{A,B}是频繁项集,则{A}和{B}也一定是频繁项集

  • 从1到k(k项集)递归查找频繁项集

  • 用得到的频繁项集生成关联规则

  • 首先我们需要求出最终频繁项集,即满足最小支持度的频繁k项集(k尽可能大)

  • 频繁项集主要通过迭代计算获取频繁k项集,迭代过程如下:
    1、计算候选区中k项集的支持度;
    2、通过枝剪过滤掉不满足最小支持度的项集,得到频繁k项集;
    3、通过全连接(或并操作)获取k+1项集;
    4、计算k+1项集的支持度,并将k+1项集移入候选区,令k=k+1;
    5、重复(1)。
    6、迭代终止条件为不存在k+1项集时,上次迭代的频繁k项集便是最终项集。

image-20230213221003683

  • 在找到所有频繁项集之后,再根据这些频繁项集来确定关联规则,步骤如下:
    1、遍历所有的最终频繁项集,对于每个频繁项集A:

    • 求出A的所有非空真子集的集合U,对U中任意互补集X和Y,利用公式
      confidence(X->Y) = P(Y|X) = P(XY)/P(X)求出置信度c,如果c小于设置的最小置信度则舍弃,如果大于则保留

image-20230213221239021

习题:

image-20230213221726958

image-20230213220312446

关联规则挖掘方法:

  • 设定最小支持度和置信度的阈值: minsup 和minconf

  • 目标:support ≥ minsup 且confidence ≥ minconf

  • 找出所有的频繁项集

  • 由频繁项集产生强关联规则

2、熟悉分类与预测算法,如KNN。
习题:

image-20230213222035609

3、熟悉聚类分析算法,如K- means。

image-20230213222211203

4、结合实际电商案例,思考如何将数据挖掘技术应用于电商领域。

电子商务中常用数据挖掘:

  1. 路径分析:

    1. 用于判断在一个Web站点中最频繁访问的路径,还有一些其他相关路径的信息也通过路径分析可以得到(例如路径访问序列)
    2. 通过路径分析, 可以改进页面及网站结构的设计
  2. 关联规则:

    1. 找到客户对网站上各种文件和资源之间访问的相互联系
    2. 利用这些相关性, 可以更好的组织站点, 实施有效的市场策略
  3. 序列模式:

    1. 与时间相关, 找到那些“ 一些项跟随另一个项” 的内部事务模式
    2. 发现序列模式能够用于预测客户的访问模式, 对客户开展有针对性的广告和促销服务
  4. 分类:

    1. 给出识别一个特殊群体的公共属性的描述
    2. 得到分类后, 就可以进行适合某一类客户的商务活动
  5. 聚类:

    1. 从Web访问信息数据中聚集出具有相似特性的那些客户
    2. ==聚类顾客信息或数据项能够便于开发和执行未来的市场战略。==例如: 自动给一个特定的顾客聚类发送销售邮件等
  • Copyright: Copyright is owned by the author. For commercial reprints, please contact the author for authorization. For non-commercial reprints, please indicate the source.
  • Copyrights © 2023-2024 Guijie Wang
  • Visitors: | Views:

请我喝杯咖啡吧~

支付宝
微信