百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

BigO表示法的基础 big的正式表达

liebian365 2024-10-29 15:55 34 浏览 0 评论


大O表示法表示相对于输入增长算法性能如何,并将输入外推到任意大甚至无限。 这为我们提供了算法在最佳情况和最坏情况下要花费的时间。

这并不能告诉我们运行算法需要多长时间(出于某种原因,我们稍后会介绍),但是可以提供一种对算法进行整体排名和比较的方法,并且可以为您提供一个评估方法。 会很大。 在大多数系统上,大O表示法对一个小的数据集并不重要,但是对于大数据集(这是我们的输入)起作用。 让我们了解一下该符号的一些基础知识。

实际的大O符号

如果您已经看过O(n2)或O(nlog2n)之类的东西,那么您已经了解了Big O表示法的基本语言。 n定义了输入的大小。 如果传递任意n,则可以看到它的大小和速度。

我们将介绍3种常见的Big O分类。 O(1)具有恒定的时间,这意味着始终需要恒定的时间来运行。 我们的线性时间为O(n),这意味着运行时间与n直接成线性关系。 最后,我们有平方时间,它随着n呈2次指数增长。 这只是冰山一角,因为几乎所有可以用数学表示的东西都可以使用。

我确实在n为1时将O(nlog2n)更改为1,因为实际上它实际上可以解决这个问题,但是从数学上来说应该为0。 看看我们的数字趋势正在发生什么。

恒定时间仅适用于对单个值或类似值的单个操作。 它根本没有考虑数据大小(因此,除非是最佳情况,否则实际上不会对我们的数据做任何事情)。 线性时间与我们的数据成正比。 与对数时间复合的线性时间的增长速度快于线性时间,但远不及二次时间。 二次时间标度这四个指标中最差的一个(但可能会更糟!)。

计算BigO的大小

让我们大致介绍一下如何计算Big O符号的大小。 另外,请注意,对于这些示例,我们将不包括任何实际的错误处理。 假设所有数据之前都已检查过,除非另有说明,否则一切都有意义。

恒定时间仅表示每个数据集有固定数量的工作。 如下所示的函数在Lua中具有O(1)的Big O表示法:

Bash
function algorithm( array )
	print( array[ 1 ] )
end

无论数组有多大,我们都只对数据集执行固定数量的操作,而与数据集的大小无关。 我们还可以:

Bash
function algorithm1( array )
	print( array[ 1 ] .. " + " .. array[ 2 ] .. " + " .. array[ 3 ] )
end

因为成本实际上是固定的,所以它仍将是O(1)。 不过,这将在我们的下一部分中发挥更大作用。

线性时间意味着我们的复杂度与数据呈线性比例关系。 每个其他项目都是一个附加操作。 使用O(n)线性时间的函数的示例为:

function algorithm( array )
	for i in pairs( array ) do
		print( array[ i ] )
	end
end

此示例仅迭代数组中的每个项目并打印每个项目。 随着数组的增加,复杂性也随之增加,但是每个额外的项目都是一个额外的动作。

线性时间加上对数时间会比较困难。 请参阅我在quicksort上的文章,以了解一种算法,其平均情况使用O(nlog2n)。

二次时间(或多项式时间)基本上是常见算法类型中最差的时间(表示为O(n2))。 对于每个额外的点,您都有n个额外的步骤,如上表所示,这些步骤的累加速度很快。 例如:

function algorithm( array )
	for i in pairs( array ) do
		for j in pairs( array ) do
			print( array[ i ] .. " " .. array[ j ] )
		end
	end
end

二次时间的另一个示例是气泡排序方法。 冒泡排序确实有其用例,因为它理论上可以在O(n)时间内完成正确类型的数据。

最优的时间

大O表示法通常也被计算为算法的平均运行时间。 该算法如何应用于任意数据集? 如果以某种方式对数据进行整形,则某些算法可能会非常有效,但是您通常想知道平均用例或最坏情况是什么。 除非另有说明,否则大O表示最坏的情况。 一个算法最多可以占用Big O表示法所说的时间,但是通常会花费较少的时间(由于四舍五入)。 您还可以使用像quicksort这样的算法,在最坏的情况下有几种可能性,但由于最坏的情况很少且有条件,因此通常运行得比预期的要好。

以下算法从技术上讲是O(n):

function algorithm( array )
	for i in pairs( array ) do
		if array[ i ] == 3 then return i end
	end
end

如果第一个项目是3,我们会一直进行下去还是只是退出? 最佳情况下的退出条件可以为O(1),但平均而言趋向于O(n / 2)(我们将其简化为O(n)),而在最坏的情况下恰好为O(n)。 根据最大的O表示法计算出最大的O表示法,以遍历任意数据集。

扔掉剩下的

大O符号专注于趋势,而不是精确地计算出所有内容。 对于任意大的集合,可以忽略任何添加的小数字或任何常量。 删除常数和尾随项,仅保留最大项。 因此,我们之前执行3次固定操作的函数仍然是O(1)而不是O(3)。 有些人会(错误地)将其写为O(k),但这不是Big O表示法的标准。

让我们以这个功能为例:

function algorithm( array )
	for h in pairs( array ) do
		print( array[ h ] .. " " .. array[ j ] )
	end

	for i in pairs( array ) do
		for j in pairs( array ) do
			print( array[ i ] .. " " .. array[ j ] )
		end
	end
end

您可以说它对O(n2+ n)有效,但是Big O本身与小项无关。 如果使用1,000个元素,那么根据我们之前的图表,这将是1,001,000个运算,而不是1,000,000个运算,这在事物的总体方案中是舍入误差。 较小的子优化可能会轻易超过实际代码中的较小舍入误差,因此Big O表示法可保持最大的增长率,而将其余的排除在外。 如果我们在同一节中重复两次循环,则结果为O(2n2),但是常数再次不重要,因此被丢弃。

应用大O表示法

大O表示法是了解算法可扩展性的最佳工具之一。 即使您将硬件考虑上,也可以在无法跟上之前投入多少? 小事情确实无关紧要,但是即使是很小的操作也会增加很多开销。 使用Big O表示法分析算法,看看它们是否有效。

例如,对大量数据使用冒泡排序是愚蠢的事,除非对其进行大量排序(这往往是最理想的情况)。 包含大多数已排序数据的快速排序可能与使用随机数据进行冒泡排序一样糟糕。 知道算法的特长,以及如何将其应用于Big O表示法,但不要忘记您正在使用该算法做什么。 此外,请记住,用15件物品完成的现代机器都不会产生太大的变化。

Big O表示法也不仅适用于运行时。 它可以应用于内存,IO等。例如,由于将整个数组加载到内存中进行排序,因此Quicksort的内存占用量将为O(n)。 如果您尝试在台式机上对8GB的数据块进行排序,除非您拥有一台功能强大的机器,否则这可能会成为一笔麻烦事。

最佳化

Big O表示法会排除常数和较小的项,这是有原因的。 与过分专注于使原理算法在规模上更有效相比,尝试过早优化可能会导致更糟糕的结果。 对于任意大的数据,O(n2+ 100n)将与O(n2)相同(这是Big O将其简化为)。 但是对于较小的数据集,这开始变得重要。

即使它实际上不适用于Big O表示法,也可能希望在初始优化阶段之后使用k或类似常数作为基准测试算法。 O(kn)的算法将比O(n)花费更长的时间。 这对于数学方面和趋势而言都无关紧要,但是用户将注意到O(n2)是否花费5秒,O(2n2)是否花费10。如果您可以将其简化为某种使用 O(n log 2 n),甚至更好,但是有时候你做不到。

首先进行大规模优化,然后再进行较小的细分。 使与数据相关的各个部分更有效,并且使算法的规模更有效。 如果您知道数据集永远不会很大,或者常量变得足够大,那么值得深入研究,或者如果数据集足够小,则着眼于容易工作的数据。 如果您已经实施了快速排序,那么为什么要重新创建轮子以添加气泡排序,以便对数据进行排序(如果最多有20个条目,而且排序不会对用户体验产生任何影响),该数据总是会接近排序的?

结论

Big O表示法功能非常强大,但重要的是不要急于尝试,过早地进行优化。 使用Big O表示法可跟踪缩放级别的效率并从中进行优化。 大O表示法不仅限于运行时间。 根据您的操作,它可用于基准测试内存,IO等。 有时,值得针对嵌入式环境中的内存问题进行更糟糕的优化。

我们没有涉及更多类型的性能级别,但是列出的是标准算法中最常见的性能级别。 还有一些其他类型,例如阶乘时间(O(n!))和指数时间(O(k?))很少见(但并不罕见)。

查看最佳和最差情况,平均情况以及要处理的数据类型。 对于您的用例不存在的一般情况通常对您没有用。 极为罕见的最佳案例也不值钱。 针对适合您的数据并适合您的工作目的的用例。 将Big O标记分析应用于您的编码将提高您的效率。 将该慢速算法抛弃掉,使它在数学上更加高效,并理解为什么要这样做。

(本文翻译自Some Dude Says的文章《The Basics of Big O Notation》,参考:https://medium.com/swlh/the-basics-of-big-o-notation-22b5f0d679cb)

相关推荐

Linux-常用操作命令介绍(linux常用的命令大全)

1.帮助命令帮助命令1.1help命令语法格式:命令--help作用:查看某个命令的帮助信息示例#ls--help#netstat--help1.2man命令语法格式:man命令...

推荐:一个小而美的Java工具类库(java工具软件)

前言是的,你没看错,没看错,它就是hutool!相信很多做java开发的朋友应该都已经认识并使用过它了,今天带大家再重温一下它都有哪些功能,并以示例来看看hutool是如何简便实现JWT认...

【SpringBoot后端开发】第三部分 Linux操作系统常用命令(3)

创作不易,请帮忙转发、点赞和评论!四、Linux常用命令对于Linux系统来说,中央处理器、内存、磁盘驱动器、键盘、鼠标、用户等都是文件,而Linux系统管理的命令是它正常运行的核心,与之DOS命令类...

linux常用命令在线查询工具(linux常用命令在线查询工具有哪些)

linuxvi编辑器常用命令linux查看iplinuxfind-name查找文件名linuxshelllinux查看端口占用linux删除文件命令linuxcp命令复制文件到另一个...

使用免费绿色工具chfs,将文件夹共享成网盘

需求:业务需求方有个需要将apk包上传到服务器中,通过chfs可以将服务器目录共享出来,可以可以登录后台自行上传apk文件包。本文就教大家三个知识点1.centos7下使用chfs,共享目录。2.使用...

Mysql和Hive之间通过Sqoop进行数据同步

文章回顾理论大数据框架原理简介大数据发展历程及技术选型实践搭建大数据运行环境之一搭建大数据运行环境之二本地MAC环境配置CPU数和内存大小查看CPU数sysctlmachdep.cpu#核数为...

真实案例记录Linux被植入rootkit导致服务器带宽跑满的解决过程

一、关于linux下的rootkitrootkit是Linux平台下最常见的一种木马后门工具,它主要通过替换系统文件来达到攻击和和隐蔽的目的,这种木马比普通木马后门更加危险和隐蔽,普通的检测工...

python周期任务调度工具Schedule使用详解

如果你想周期性地执行某个Python脚本,最出名的选择应该是Crontab脚本,但是Crontab具有以下缺点:不方便执行秒级任务。当需要执行的定时任务有上百个的时候,Crontab的管...

Linux 系统日常巡检脚本(shell巡检脚本)

Linux系统日常巡检脚本,巡检内容包含了,磁盘,内存cpu进程文件更改用户登录等一系列的操作直接用就行了。报告以邮件发送到邮箱在log下生成巡检报告。#!/bin/bash#@Au...

Schedule—简单实用的 Python 周期任务调度工具

如果你想周期性地执行某个Python脚本,最出名的选择应该是Crontab脚本,但是Crontab具有以下缺点:1.不方便执行秒级任务。2.当需要执行的定时任务有上百个的时候,Cronta...

celery定时与异步任务详解(定时任务异步执行)

celery简介Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的异步任务队列,同时也支持任务调度。Celery的架构由三部分组成,消息中间件(messagebroke...

开源免费的定时任务管理系统:Gocron

Gocron:精准调度未来,你的全能定时任务管理工具!-精选真开源,释放新价值。概览Gocron是github上一个开源免费的定时任务管理系统。它使用Go语言开发,是一个轻量级定时任务集中调度和管理...

PHP Laravel定时任务Schedule(laravel定时任务原理)

前提:本文方法是利用Linux的crontab定时任务来协助实现Laravel调度(Mac也一样)。一、首先添加Crontab定时任务,这里只做简单介绍:用命令crontab-e添加如下内容**...

Linux的常用命令就是记不住,怎么办?于是推出了这套教程

1.帮助命令1.1help命令#语法格式:命令--help#作用:查看某个命令的帮助信息#示例:#ls--help查看ls命令的帮助信息#netst...

如何定期执行 Python 脚本:5 种常见方法

定期执行任务是自动化工作流程中的重要环节,无论是数据抓取、文件备份,还是定期报告生成,定时运行脚本都可以极大提高效率。本文将介绍五种方法,通过这些方法,你可以轻松设置定期执行Python脚本的任务...

取消回复欢迎 发表评论: