database -以分贝存储图像-是还是否?

Translate

因此,我正在使用一个将图像大量存储在数据库中的应用程序。您对此有何看法?我更喜欢将位置存储在文件系统中,而不是直接将其存储在数据库中。

您认为优点/缺点是什么?

This question and all comments follow the "Attribution Required."

所有的回答

Translate

我负责一些管理许多TB图像的应用程序。我们发现文件路径在数据库中最好。

有几个问题:

  • 数据库存储通常比文件系统存储更昂贵
  • you can super-accelerate file system access with standard off the shelf products
    • 例如,许多Web服务器都使用操作系统的发送文件()系统调用以异步方式将文件直接从文件系统直接发送到网络接口。存储在数据库中的图像无法从此优化中受益。
  • 诸如Web服务器等之类的东西,不需要特殊的编码或处理即可访问文件系统中的图像
  • databases win out where transactional integrity between the image and metadata are important.
    • 管理数据库元数据和文件系统数据之间的完整性更加复杂
    • (在Web应用程序的上下文中)很难保证数据已刷新到文件系统上的磁盘
来源
Rad
Translate

与大多数问题一样,它并不像听起来那样简单。在某些情况下,将图像存储在数据库中是有意义的。

  • 您要存储动态变化的图像(例如发票),并且想要获得2007年1月1日的发票吗?
  • 政府希望您保持6年的历史
  • 存储在数据库中的映像不需要其他备份策略。存储在文件系统上的图像可以
  • 如果图像在数据库中,则更易于控制对图像的访问。空闲管理员可以访问磁盘上的任何文件夹。真正确定的管理员需要窥探数据库来提取图像

另一方面,存在相关的问题

  • 需要其他代码来提取和流式传输图像
  • 延迟可能比直接文件访问慢
  • 数据库服务器上的负载较重
来源
Anna Lee
Translate

文件存储。 Facebook工程师对此进行了精彩的演讲。一个收获是知道目录中文件的实际限制。

大海捞针:有效存储数十亿张照片

来源
Translate

这可能会花费很多时间,但是如果您正在使用(或计划使用)SQL Server 2008,我建议您看看新的文件流数据类型。

FileStream解决了将文件存储在DB中的大多数问题:

  1. Blob实际上是作为文件存储在文件夹中的。
  2. 可以使用以下命令访问Blob要么数据库连接or在文件系统上。
  3. 备份已集成。
  4. 迁移“行之有效”。

但是,SQL的“透明数据加密”不会加密FileStream对象,因此,如果考虑到这一点,最好将它们存储为varbinary。

从MSDN文章:

Transact-SQL语句可以插入,更新,查询,搜索和备份FILESTREAM数据。 Win32文件系统接口提供对数据的流式访问。
FILESTREAM使用NT系统缓存来缓存文件数据。这有助于减少FILESTREAM数据可能对数据库引擎性能产生的任何影响。不使用SQL Server缓冲池;因此,此内存可用于查询处理。

来源
Translate

数据库中的文件路径是肯定的应对之道-我听过TB图像客户的故事说,试图在数据库中存储任何数量的图像成为一场噩梦-仅性能方面的影响就太大了。

来源
Laura Lee
Translate

以我的经验,有时最简单的解决方案是根据主键命名图像。因此,很容易找到属于特定记录的图像,反之亦然。但同时您不存储任何东西关于数据库中的图像。

来源
Regan Lee
Translate

这里的诀窍是不要成为狂热分子。

这里要注意的一件事是,专业文件系统阵营中没有人列出特定的文件系统。这是否意味着从FAT16到ZFS的所有内容都能轻松击败每个数据库?

没有。

事实是,即使我们只在谈论原始速度,许多数据库也击败了许多文件系统。

正确的做法是为您的精确方案做出正确的决定,并且要这样做,您将需要一些数字和一些用例估计。

来源
Translate

在必须保证引用完整性和ACID兼容性的地方,需要将图像存储在数据库中。

您不能事务性地保证图像和存储在数据库中的图像的元数据引用相同的文件。换句话说,不可能保证文件系统上的文件仅与元数据同时在同一事务中进行更改。

来源
Andre Lee
Translate

正如其他人所说,SQL 2008带有Filestream类型,该类型允许您将文件名或标识符作为指针存储在db中,并自动将映像存储在文件系统中,这是一个很好的方案。

如果您使用的是较旧的数据库,那么我想说的是,如果将其存储为Blob数据,那么您实际上将不会从数据库中获取任何东西来搜索特征,因此,这可能是最好的在文件系统上存储地址,并以这种方式存储映像。

这样,您还可以节省文件系统上的空间,因为您将只节省确切的空间量,甚至节省文件系统上的压缩空间。

另外,您可以决定保存一些结构或元素,以使您能够浏览文件系统中的原始图像而没有任何数据库命中,或将文件批量传输到另一个系统,硬盘驱动器,S3或另一个方案中-更新其中的位置您的程序,但保持结构,再次尝试增加存储量时,尝试将图像从数据库中取出来并没有太大的影响。

可能还会允许您根据常用的图像URL向Web引擎/程序中添加一些缓存元素,因此也可以将自己保存在那里。

来源
Josephine Lee
Translate

不经常编辑的小型静态图像(不超过几个兆)应存储在数据库中。此方法具有以下优点:易于移植(图像与数据库一起传输),易于备份/还原(图像与数据库备份)和更好的可伸缩性(包含数千个小缩略图文件的文件系统文件夹听起来像是可伸缩性的噩梦)。我)。

从数据库提供图像很容易,只需实现一个http处理程序,该处理程序将从DB服务器返回的字节数组作为二进制流提供服务。

来源
Translate

这是有关该主题的有趣的白皮书。

到BLOB或不到BLOB:数据库或文件系统中的大对象存储

答案是“取决于情况”。当然,这将取决于数据库服务器及其Blob存储方法。它还取决于存储在Blob中的数据类型,以及如何访问该数据。

使用数据库作为存储机制,可以有效地存储和传送较小尺寸的文件。较大的文件可能最好使用文件系统来存储,尤其是如果它们经常被修改/更新时。 (斑点分散成为性能问题。)

还有一点要牢记。支持使用数据库存储Blob的原因之一是符合ACID。但是,测试人员在白皮书中使用的方法(SQL Server的“大容量日志记录”选项)使SQL Server吞吐量增加了一倍,有效地将ACID中的“ D”更改为“ d”,因为未使用Blob数据记录事务的初始写入。因此,如果完全ACID遵从性是系统的重要要求,则在将文件I / O与数据库Blob I / O进行比较时,将数据库写入的SQL Server吞吐量数据减半。

来源
Baron Lee
Translate

我尚未见任何人提及的一件事,但绝对值得注意的是,在大多数文件系统中存储大量图像也存在一些问题。例如,如果您采用上述方法,并以主键命名每个图像文件,那么在大多数文件系统上,如果您将所有图像都放置在一个很大的目录中,然后尝试将所有图像放在一个大目录中,则会遇到问题(例如数十万或数百万)。

一种常见的解决方案是将它们散列到平衡的子目录树中。

来源
Yetta Lee
Translate

没有人提到过,数据库保证原子动作,事务完整性和并发性。即使是文件系统,参照完整性也无法显示-那么您如何知道您的文件名确实仍然正确?

如果您将图像保存在文件系统中,并且在编写新版本甚至删除文件时有人正在读取文件-会发生什么?

我们使用Blob是因为它们也更易于管理(备份,复制,传输)。他们为我们运作良好。

来源
Haley Lee
Translate

仅将图像的文件路径存储在数据库中的问题是不再可以强制数据库的完整性。

如果文件路径指向的实际映像不可用,则数据库会不经意间出现完整性错误。

假设这些图片是所追求的实际数据,并且可以在一个集成数据库中更轻松地进行管理(这些图片不会突然消失),而不必与某种文件系统进行交互(如果文件系统是独立访问的,图像可能突然“消失”),我将其直接存储为BLOB等。

来源
Conrad Lee
Translate

在我曾经工作过的一家公司中,我们在Oracle 8i(当时为9i)数据库中存储了1.55亿张图像。价值7.5TB。

来源
Ward Lee
Translate

通常,我坚决反对采用最昂贵,最难扩展的部分基础架构(数据库)并将所有负载放入其中。另一方面:它极大地简化了备份策略,尤其是当您有多个Web服务器并且需要以某种方式保持数据同步时。

像大多数其他事情一样,这取决于预期的规模和预算。

来源
Carol Lee
Translate

我们已经实现了一个文档映像系统,它将所有图像存储在SQL2005 blob字段中。目前有数百GB,我们看到响应时间极好,性能几乎没有下降。此外,为了符合法规要求,我们有一个中间件层,可将新发布的文档存档到光学自动点唱机系统,该系统将其公开为标准NTFS文件系统。

我们对结果感到非常满意,尤其是在以下方面:

  1. 易于复制和备份
  2. 能够轻松实现文档版本控制系统
来源
James Lee
Translate

如果这是基于Web的应用程序,则将图像存储在第三方存储交付网络(例如Amazon的S3或Nirvanix平台)上可能会有优势。

来源
Translate

假设:应用程序已启用网络/基于网络

令我惊讶的是,没有人真正提到这一点...将其委托给其他专家->使用第三方图片/文件托管服务提供商.

将文件存储在付费在线服务上,例如

另一个StackOverflow线程正在谈论这个这里.

这个线程解释了为什么您应该使用第三方托管服务提供商。

非常值得。他们有效地存储了它。没有带宽从您的服务器上传到客户端请求等。

来源
Veromca Lee
Translate

如果您不在SQL Server 2008上,并且有一些可靠的理由将特定的图像文件放入数据库中,则可以采用“两种”方法,并将文件系统用作临时缓存,并将数据库用作主存储库。

例如,您的业务逻辑可以在提供图像之前检查光盘上是否存在映像文件,并在必要时从数据库中检索。这为您提供了多个Web服务器的功能,并减少了同步问题。

来源
Marvin Lee
Translate

我不确定这是多少“真实世界”示例,但是我目前有一个应用程序可以存储交易卡游戏的详细信息,包括卡的图像。迄今为止,数据库的记录数仅为2851条,但是考虑到某些卡片已被多次释放并具有备用图稿,因此按尺寸扫描实际上可以更有效地扫描图稿的“主要方块”根据要求生成卡的边框和其他效果。

该图像库的原始创建者创建了一个数据访问类,该类根据请求来呈现图像,并且它对于查看和单独的卡片非常快。

这也简化了发行新卡时的部署/更新,而不是压缩整个图像文件夹并将其发送到管道中并确保创建正确的文件夹结构,我只是更新数据库并让用户再次下载它。目前,该文件的大小最大为56MB,这不是很好,但我正在为将来的发行版开发增量更新功能。此外,该应用程序有一个“无图像”版本,允许那些通过拨号方式获得应用程序的用户不会下载延迟。

迄今为止,该解决方案一直非常有效,因为应用程序本身的目标是在桌面上作为单个实例。有一个网站将所有这些数据存档以供联机访问,但是我绝不会使用相同的解决方案。我同意最好使用文件访问权限,因为它可以更好地扩展对图像的请求频率和数量。

希望这不会太ba,但我看到了这个话题,并希望从相对成功的中小型应用程序中提供一些见解。

来源
Harold Lee
Translate

SQL Server 2008提供了一个兼具两全其美的解决方案:文件流数据类型.

像常规表一样对其进行管理,并具有文件系统的性能。

来源
Miles Lee
Translate

这取决于要存储的图像数量及其大小。我过去曾使用数据库来存储图像,并且我的经验还不错。

IMO,使用数据库存储图像的优点是

答:您不需要FS结构来保存图像
B.当要存储更多项目时,数据库索引的性能比FS树更好
C.智能调优的数据库在缓存查询结果方面表现出色
D.备份很简单。如果您已经设置了复制并且内容是从附近的服务器传递的,那么它也很好用。在这种情况下,不需要显式同步。

如果您的映像很小(例如<64k),并且数据库的存储引擎支持内联(记录中)BLOB,则由于不需要进行间接访问,因此可以进一步提高性能(实现了引用的局部性)。

当您处理少量的大尺寸图像时,存储图像可能不是一个好主意。在db中存储图像的另一个问题是,创建,修改日期等元数据必须由应用程序处理。

来源
Ingrid Lee
Translate

我最近创建了一个PHP / MySQL应用程序,该程序将PDF / Word文件存储在MySQL表中(到目前为止每个文件最大40MB)。

优点:

  • 上载的文件将与其他所有文件一起复制到备份服务器,不需要单独的备份策略(请放心)。
  • 设置Web服务器稍微简单一些,因为我不需要上载/文件夹,也不必告诉我所有的应用程序在哪里。
  • 我可以使用事务进行编辑以提高数据完整性-我不必担心孤立和丢失的文件

缺点:

  • mysqldump现在花费了很多时间,因为其中一个表中有500MB的文件数据。
  • 与文件系统相比,整体内存/ CPU效率不高

我将我的实施称为成功,它可以满足备份要求并简化项目的布局。对于使用该应用程序的20至30个人而言,性能不错。

来源
ila
Translate

以我的经验,我必须管理两种情况:存储在数据库中的图像和存储在db中的文件系统上的图像。

第一种解决方案,即数据库中的图像,在某种程度上“更干净”,因为您的数据访问层将只需要处理数据库对象。但这仅在您必须处理少量数字时才有用。

显然,当您处理二进制大对象时,数据库访问性能会下降,并且数据库尺寸将增长很多,从而再次导致性能损失……并且通常数据库空间比文件系统空间昂贵得多。

另一方面,在文件系统中存储较大的二进制对象将导致您具有必须同时考虑数据库和文件系统的备份计划,这对于某些系统可能是个问题。

选择文件系统的另一个原因是,当您必须通过第三方访问权限共享图像数据(或声音,视频等)时:目前,我正在开发一个使用必须从“外部”访问图像的Web应用程序我的Web场以一种根本不可能访问数据库以检索二进制数据的方式。因此,有时也有一些设计注意事项将促使您做出选择。

在做出选择时,还请考虑一下,如果在访问二进制对象时必须处理权限和身份验证:当将数据存储在db中时,通常可以较容易地解决这些要求。

来源
Florence Lee
Translate

我曾经从事图像处理应用程序。我们将上传的图像存储在/ images / [今天的日期] / [id号]之类的目录中。但是,我们还从图像中提取了元数据(exif数据),并将其以及时间戳等存储在数据库中。

来源
Violet Lee
Translate

在上一个项目中,我将图像存储在文件系统上,这导致了备份,复制和文件系统与数据库不同步的许多麻烦。

在我的最新项目中,我将图像存储在数据库中,并将其缓存在文件系统上,并且效果很好。到目前为止,我还没有遇到任何问题。

来源
Samantha Lee
Translate

其次是关于文件路径的建议。我参与了一些项目,这些项目需要管理大量资产,而且任何直接将内容存储在数据库中的尝试都会长期造成痛苦和挫折。

关于将它们存储在数据库中,我可以想到的唯一真正的“专业人士”是轻松实现单个图像资产的潜力。如果没有要使用的文件路径,并且所有图像都直接从数据库中流式传输,则不会有用户发现他们不应访问的文件的危险。

不过,似乎可以通过中间脚本从无法访问Web的文件存储中提取数据来更好地解决。因此,数据库存储并不是真正必要的。

来源
Tyrone Lee
Translate

俗话说,除非您是数据库供应商,试图证明您的数据库可以做到(例如,微软吹嘘Terraserver在SQL Server中存储数十亿个图像),否则这不是一个好主意。当替代方案-将图像存储在文件服务器上和数据库中的路径变得如此简单时,为什么要麻烦呢? Blob字段有点像SUV的越野功能-大多数人不使用它们,那些通常会遇到麻烦的人,然后有些人却遇到了麻烦,但这只是出于乐趣。

来源
Translate

将图像存储在数据库中仍然意味着图像数据最终位于文件系统中的某个位置,但是被遮盖了,因此您无法直接访问它。

+ ves:

  • 数据库完整性
  • 它易于管理,因为您不必担心添加或删除图像时保持文件系统同步

-ves:

  • 性能损失-数据库查找通常比文件系统查找慢
  • 您不能直接编辑图像(裁剪,调整大小)

两种方法都是通用且已实践的。看一下优点和缺点。无论哪种方式,您都必须考虑如何克服这些缺点。存储在数据库中通常意味着调整数据库参数并实现某种缓存。使用文件系统要求您找到某种使文件系统+数据库保持同步的方法。

来源